通过 15 分钟简单读出随机文本,就能生成「跟你自己的声音很相似」语音的 iPhone 新功能「个人声音(Personal Voice)」。 不用等到iOS 18的Apple Intelligence苹果智慧,甚至在iOS 17就能玩到!
通过 15 分钟简单读出随机文本,就能生成「跟你自己的声音很相似」语音的 iPhone 新功能「个人声音(Personal Voice)」。 不用等到iOS 18的Apple Intelligence苹果智慧,甚至在iOS 17就能玩到! 而且不仅 iPhone 还支持 Mac 与 iPad。 快跟安软网团队一起看看,这项功能要怎么使用,以及使用起来的效果如何吧!
▲图片来源:Apple
「个人声音」支持系统设备
- iOS 17、iPadOS 17 或 macOS Sonoma 以上版本
- iPhone 12 或后续机型
- iPad Air(第 5 代)
- iPad Pro(11 英寸,第 3 代)或后续机型
- iPad Pro(12.9 英寸,第 5 代)或后续机型
- 配备苹果芯片的Mac
使用教程
虽然实际上系统要能帮忙念出自己声音的耗时不只 15 分钟(这个我们后面会提到)。 但能够简单花约 15 分钟念出随机的语句,就能让 iPhone 帮忙「出嘴」以类似你的个人声音的模拟语音来念出指定的文字的功能。 不意外的与协助身障人士的辅助功能有关系。

就官方的说法,「个人声音」主要是为罹患肌萎缩性脊髓侧索硬化症(ALS)或其他可能会逐渐侵蚀说话能力的疾病所打造,是为了造福人类立意良善(但又展现出苹果 AI 实力)的好功能。
不过因为感觉很像是网络上目前到处传唱各种模仿歌手的 AI 语音模拟的功能很像,加上在后续的 iOS 18 更新后也支持了中文因此让人充满延伸应用的想象空间。

从「设置 > 辅助功能 > 个人声音」一路点进来,便可通过「制作个人声音」开始进行 iPhone / iPad / Mac 学习声音的工作。 在此页面则是可以选择是否要让学习到的声音可以在设备之间共享 – 我会选可以啦! 毕竟一个设备一个设备弄也是要很久的时间。

录音之前的注意事项建议要看一下。 期间会需要大声朗读 150 个词句。 就说明是提到这可能需要大约 15 分钟,实际上个人觉得需要蛮久时间的。 但不用担心会需要一路录完,因为即使中断也是随时可以继续录制没问题的。

按了继续之后可以选择语言。 目前个人声音除了英文之外,在iOS 18上则是新增了对应中文的支持。 继续往下选择则是可以自定义这组声音的名称。

录制之前的准备其实蛮多的。 最难的应该是「寻找一个安静的地方」这点。

因为寻着步骤继续下去,系统会先引导你进行录音来确认声音质量。

这部分笔者自己尝试,是旁边如果有风扇或冷气之类的白噪音,它基本上都会提示需要更安静的地方才能录制到比较高质量的「个人声音」表现。
就系统引导的重点包括,在回音和背景噪音最小的房间中录制,并且还需要保持自然说话的方式 – 以一致的音量朗读,像在和他人对话一样。 然后把装置保持在约15至30公分的距离外录制最好。

录制时会像上面这样,提出一段句子让你念 – 开始时可以选择一句的长度。

过程里你可以随时通过底部的选项选择是要让它自动侦测来持续录制,或者是每个词句都要手动选择继续。 念错也可以按下暂停来重新念。
如果遇到不太会念的字词,则是可以通过「试听」来通过语音参考 – 小编测试刻意用的是英文,如果是中文应该不太会有念不出来的词。 因为例句基本上都蛮生活化的。

由于总共有 150 个句子需要你念,所以真的会需要一段时间。 但个人测试,将界面一直开着的话,即便是锁定屏幕之后再返回也不会被取消关闭,可以快速接续录制。 而就界面的说明则是提到其实是可以随时储存并关闭阶段也没有问题的 – 但笔者是直接不跳出,在偶尔休息时关闭屏幕,基本上算是一次念完。

完成录制之后,则是会进入 iPhone 自己要疯狂运算时间 – 毕竟不能倚靠外部服务,得靠(理论上)隐私最好的「设备上」进行运算。
这样的程序在 iOS 中会默认需要插上电充电才能进行。 完成之后则是会收到通知,在个人声音的设置之中,你可以随时掌握 iPhone 目前处理的进度。

整个程序基本上是会耗时至少数个小时以上 – 因为这样本篇前面才会说,原本以为是 15 分钟的,想不到那只是「录制」的时间,处理的话甚至有可能会需要隔夜才能完成使用。
隔天早上看到完成的通知了。

之后便能通过系统界面来使用「个人声音」来念出屏幕上的文字 – 有兴趣的朋友可以看看视频社群平台上的精彩演示。
然后我之所以让它学习英文版本的,就是想要实现「我终于可以把英文讲的这麽流畅」的梦想了(灿笑)。

基本上「个人声音」会在辅助功能之中的「实时语音」功能里,成为一个新的「声音」选项。 在设置里启动实时语音功能后,即可通过按三下侧边按钮来启动接口(如上图)。 基本上就能通过打字,并且选择「Send/传送」来让系统通过装置扬声器来语音沟通。
通过个人声音的设置,你可以选择输出自己的录音或者是删除掉这个语音功能。 基本上就如同苹果一直以来主打的那样,隐私基本上都控制在你的手上。 有机会的话,真的可以玩玩看,个人觉得蛮有意思而且还真的蛮像的啊!