【环球网科技综合报道】5月16日消息,据外媒报道,谷歌近日将为Android操作系统和Chrome浏览器推出一系列全新人工智能及辅助功能,旨在进一步提升用户体验,尤其是为残障人士和有特殊需求的用户提供更多便利。
在安卓系统方面,屏幕阅读器TalkBack迎来重要升级。去年,谷歌已将Gemini人工智能功能引入TalkBack,使盲人或视力低下用户即便在图片缺乏Alt文本的情况下,也能借助AI生成的描述了解图片内容。此次升级后,用户不仅能获取图片描述,还能针对图片内容提出具体问题并获得解答。例如,当收到朋友发送的新吉他照片时,用户可询问吉他的品牌、颜色等细节。此外,TalkBack的功能扩展至整个手机屏幕,用户在应用程序购物时,可向Gemini询问感兴趣商品的材质、是否有折扣等信息,让信息获取更加便捷精准。
同时,安卓的实时字幕功能Expressive Captions也进行了更新。该功能利用人工智能技术,不仅能捕捉说话内容,还能识别说话方式。谷歌注意到人们在表达时有时会拖长声音,因此在“Expressive Captions”中新增了时长功能。通过这一功能,用户能够分辨出体育播音员是在激动地喊“精彩一击”,还是有人拉长声音说“不——”。此外,实时字幕还将显示新的声音标签,如有人吹口哨或清嗓子时,字幕会相应标注,让用户更全面地感知对话场景。此更新将率先在美国、英国、加拿大和澳大利亚推出,适用于运行Android 15及更高版本的设备。
在Chrome浏览器方面,谷歌简化了访问PDF文档的操作。此前,桌面版Chrome浏览器中,用户无法使用屏幕阅读器与扫描的PDF文档进行交互。如今,Chrome借助光学字符识别(OCR)技术,可自动识别这类PDF文档,用户不仅能像浏览普通网页一样对文本进行高亮显示、复制和搜索,还能通过屏幕阅读器阅读内容,极大提升了处理扫描PDF文档的便利性。
另外,安卓版Chrome浏览器的页面缩放功能也得到优化。用户现在可以在不影响网页布局的前提下放大显示文本,还能自定义放大程度,并选择将首选项应用于所有页面或特定页面。用户可通过点击Chrome右上角的三点菜单访问该功能,满足不同用户对网页显示效果的个性化需求。(纯钧)
上一篇:转人工客服,怎么这么难?