现在,免费的人工智能工具能够提取 78 转唱片上的歌词。结果可能不是完整的歌词,但我们希望它能帮助您浏览、搜索和研究。
Whisper是 OpenAI 推出的一款开源工具,其“在英语语音识别方面,其稳健性和准确性已接近人类水平”。它不仅能识别嘈杂磁盘上的语音,还能识别歌唱的歌词,这让我们感到惊讶。
例如,在唐纳德·查尔默斯 (Donald Chalmers)、哈维·欣德迈尔 (Harvey Hindermyer) 和 E. 奥斯汀·基思 (E. Austin Keith) 创作的《As We Parted At The Gate》(1915) 中,该工具发现了以下文字:
[…] 我们在城门口分别,
我以为我的心会因此而萎缩。
如今我常常仿佛听到她最后的告别。
夜空中闪烁的星光,永远不会像我们在城门口分别
前那样明亮。许多年过去了,自从我再 海外数据 次离开,把我深爱的女孩远远抛在身后。但我又一次徘徊回来,今天我经过小屋的门,我的爱人,我将在这里居住。所有的道路,它们在集市上飞驰,但那里却缺少了信仰。我听到一个声音在重复,你要活下去。我想起过去的日子,她的眼里噙满了泪水。那天晚上,我们在城门口分别,当我们在城门口分别时,我以为我的心会因此而萎缩。如今我常常仿佛听到她最后的告别。夜空中闪烁的星光,永远不会像我们在城门口分别前那样明亮。
所有摘录的文本现已发布——我们希望它有助于理解这些早期录音。请注意,这些是历史资料,因此可能存在冒犯性内容,也可能存在抄录错误。
我们非常感激加州大学圣巴巴拉分校图书馆今年向互联网档案馆的“Great 78 Project”(大78项目)捐赠了一套几乎完整的百年爱迪生录音转写本。这些录音和转写本的质量非常高,自动化工具甚至能够辨认出其中的许多文字。
下一步是将这些文本整合到互联网档案馆的浏览和搜索界面中。
本系列文章中有一篇是关于互联网档案馆如何使用人工智能来帮助建立图书馆的文章
-
- Posts: 517
- Joined: Tue Dec 24, 2024 4:30 am