银河优越会GEG
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • “广告位”不增反减还能盈利?

    2026-05-11 23:44

    近期在小米内部,组建了一支“互联网商业部”号称业内的特种部队。把原来分散在各产品的互联网流量平台,并招揽众多大数据专家等。专门来负责小米国内互联网商业化的目标,北京网站开发团队小编和你说说这

  • “流量枯竭、红利消失”都不可怕,可怕的是不能脚踏实地做好“自己

    2026-05-02 22:30

    ”如果时间回到十年前,开个淘宝店想必能赚不少钱。九年前研发北京APP开发,各种小应用轻松斩获无数用户。2010年开始玩微博,可能早成为了网红。2012年开始做公众号,即时是复制黏贴也能成大号

  • 常见的产品网站类型你了解吗 网站UI设计要素

    2026-04-19 15:42

    对于企业网站建设而言,产品展示几乎成为所有企业建站的初始目的和嘴关注的网站开发设计部分。好的产品展示设计,往往可以将企业的品牌产品和专业服务内容很好的传达给企业客户,那么企业网站的产品展示主

  • 互联网+医疗从“抗疫”前线走向未来

    2026-04-14 09:22

    新冠病毒疫情爆发以来,从各大互联网网站开发公司及医疗机构自发上线互联网网站开发医疗服务,到国家卫健委下发通知明确要求利用好互联网网站开发医疗资源,互联网网站开发医疗服务的应用在短短一月的时间

  • 常见的制作网站步骤你了解的够详细吗?

    2026-04-12 13:38

    在进行北京网站设计制作页面时,色彩要偏冷而且调性要鲜明平和。素材要统一不要太多的事物元素,减少用户的联系空间,让用户的关联空间进行延展。当网站开发用户打开时发现很刺眼,首先从视觉上就会让用户

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-05-01 21:29
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。