微软与浙大开发出新AI模型解决语音助手卡顿问题

雷锋网消息,在 12 月 8 日至 14 日于温哥华召开的机器学习顶会之一 NeurIPS 2019 会议上,微软和浙江大学研究人员介绍了文本-语音模型 FastSpeech,该模型可大幅提升文本语音转换过程中梅尔谱的生成速度,语音生成速度比基线快 38 倍。

因此,研究团队表示,FastSpeech 兼具快速、鲁棒、可控等特点。

文化和旅游部办公厅1月26日正式对外发布通知:为做好新型冠状病毒感染的肺炎疫情防控工作,即日起,全国旅行社及在线旅游企业暂停经营团队旅游及“机票+酒店”旅游产品。已出行的旅游团队,可按合同约定继续完成行程。行程中,密切关注游客身体状况,做好健康防护。

二是不断提高政治站位,切实提升服务国家战略和实体经济能力。“重振国寿要着力在贯彻落实党中央决策部署上走在前列、作出表率”,王滨董事长表示,中国人寿要主动服务大局,坚决推动国家战略落地和实体经济发展,把服务实体经济作为开展工作的出发点和落脚点,将国家发展的重点区域、重点产业、重点行业作为服务主阵地;要保持决战态势,坚决助力打赢脱贫攻坚战,在种好定点扶贫县“责任田”的同时,精准实施中国人寿“扶贫保”工程;要持续强化风险防控,坚决守牢风险底线。

如企业有特殊情况无力按期缴纳疫情结束之后的土地出让金,企业可书面申请“一事一议”。交地时间将根据缴款到位时间进行相应的顺延,确有困难的企业可申请对开、竣工时间进行延期;鼓励有条件的企业提前缴款、提前开工,加快项目开发建设,地块所在区政府(管委会)应给予积极支持。

与此同时,2019年,中国人寿更加注重价值、服务、科技,重振国寿三大转型成效明显。寿险领先地位进一步稳固,新业务价值快速增长,“一体多元”布局、“大个险”组织体系建设初步成型;财险保费增速跑赢大市,销售体系不断优化,新一代核心系统建设基本完成;广发银行营业收入、净利润大幅增长,网点智汇柜台替代率达80%;职业年金拓展成果丰硕,企业年金对标优势扩大;海外公司一年新业务价值大幅增长。全年赔付件数超1800万件,赔付金额超2300亿元,全流程智能化处理赔案超1100万件。

速度慢:端到端模型通常以自回归方式生成梅尔谱,再通过声码器合成语音,而一段语音的梅尔谱通常能到几百上千帧,导致合成速度较慢; 稳定性差:序列生成的错误传播及注意力对齐不准,会导致出现重复吐词或漏词现象; 缺乏可控性:自回归的神经网络模型自动决定一条语音的生成长度,不易控制语速或韵律停顿等。

《通知》自发布之日起执行,南京江北新区及江宁、浦口、六合、溧水、高淳区参照本《通知》执行。(完)

2丨紧急通知!全国旅行社及在线旅游企业暂停团队游及“机票+酒店”旅游产品

研究团队表示,FastSpeech 的质量几乎与谷歌的 Tacotron 2 文本-语音模型相当,在稳定性上轻松超过主流的 Transformer 模型。同时,与基线的 34% 有效错误率相比,FastSpeech 的有效错误率为零。(但不可否认的是,其稳定性测试只涉及 50 个语义复杂的句子) 此外,FastSpeech 能在保持准确度的前提下,将生成的语音速度从 0.5 倍变为 1.5 倍。

无死角,让党员干部和普通群众齐上阵。对于传染病来说,切断传播途径是非常重要的解决办法,通过物理上的交通管制,确保切断实际上的传染病扩散。全面动员、内防扩散、外防输出,要把基层党组织动员起来,把群众动员起来,才能确保疫情管控力大于疫情传播力。此次防疫过程中,河南省的“硬核操作”被网友称为防疫“教科书”,收获“点赞”无数,频繁上热搜,无论是城市社区还是农村街道,既有党员干部挨家挨户全面排查武汉甚至外来人口的身影,也有普通村民的“防疫大招”,如自发在村口设立“劝返点”、社区大爷拒绝探亲隔空投送口罩和红包等,切实做到人人参与、严防死守、防患未然。此外,浙江省的“三防”主线、“十个最”防控措施也充分激发干群力量,各地创新方式全面发动,如浙江丽水16辆巡回诊疗车开进167个乡村,巡回到村、服务到户、宣传到人、排摸到位,为百姓的安全感筑牢道道防线。

1月22日武汉到成都D361次列车14号车厢乘客 请立即与当地疾控中心联系

5丨日本民间捐100万只口罩驰援武汉

目前,Google Assistant 语音助手及最近出现在 Alexa 和 Amazon Polly 服务中的新闻播音员的语音乍听上去几乎与人声无异。事实上,这些语音助手都是由文本-语音模型提供支持的。

《通知》明确,自1月24日江苏省启动突发公共卫生事件一级响应之日起,至一级响应结束之日止,企业可就土地出让合同(含补充协议)申请重新签订补充协议,重新约定相关合同条款。

6丨中国铁路成都局发布停运消息:成贵高铁、沪昆高铁部分列车停运

为验证 FastSpeech 的有效性,研究人员将其与开源的 LJ Speech 数据集进行了对比,该数据集包含 13100 个英语音频片段(相当于 24 个小时的音频)和相应的文本转录。在将数据集随机分成用于训练的 12500 个样本、用于验证的 300 个样本和用于测试的 300 个样本后,他们对语音质量、稳定性等进行了一系列评估。

缴款时间在一级响应期之前且已产生违约责任的,则该期款项在1月24日之前按出让合同约定缴纳违约金,1月24日至一级响应结束后三个工作日内不计利息和违约金。

论文的最后,研究团队也提到,未来将把 FastSpeech 和速度更快的声码器组合成单一模型,提供完全端到端的文本-语音解决方案。

针对2020年工作部署,王滨董事长强调抓好以下重点工作:

3丨三部门:疫情解除前全国禁止野生动物交易

缴款时间在疫情一级响应期内的,该期款项缴款时间可延期至一级响应结束后的第三个工作日,期间不计利息或违约金;如届时企业仍有困难,可再延长不超过30日(自然日)缴纳;为规范企业在疫情一级响应期间理性参与南京土地市场的竞争,凡2020年1月24日以后出让及正在公告的地块,首付款应按挂牌出让文件约定的时间缴纳,剩余款项参照上述意见执行。

王滨董事长明确,2020年工作总体要求是“稳中求进、价值优先、协同发展、强化治理”。要确保稳业务、稳投资、稳效益、稳经营,同时积极进取跑赢大市、争先进位;要以提高发展质量和经营效益为中心,全面强化价值创造;要强化统筹协调、资源共享、优势互补,真正做到对外“一个客户、一个国寿”、对内“一个集团、一个国寿”;要推进公司治理现代化,切实把制度优势转化为治理效能。

三是大力强化价值创造,不断提升核心竞争力。王滨董事长强调,要聚焦价值创造这一纵深推进重振国寿的核心轴,实施“价值优先型”企业建设,要坚持经济价值和社会价值创造并重、集团价值和子公司价值创造并重、做强传统业务和做大新兴业务并重,在业务提质增速、科技创新赋能、服务整合提升、协同升级提效上形成价值创造体系。要持续提升业务价值,保险板块坚持价值引领,投资板块坚定推进投资收益和投资能力双提升,银行板块加快高质量发展步伐。要持续深化科技创新、提高服务质量、推动协同发展。

四是着力加强制度建设,积极提升公司治理现代化水平。要优化体制机制,推动重振国寿行稳致远,夯实治理单元,确保重振国寿落到实处,提高治理能力,不断夯实重振国寿根基。要构建高质量发展机制,进一步聚焦重振国寿核心轴,构建创新驱动发展机制,进一步激活重振国寿动力源(600405,股吧),构建均衡协调发展机制,进一步打造重振国寿增长极,构建风险防控机制,进一步织密重振国寿防护网。

但是,这种合成方法存在着一些不可避免的问题,主要包括:

人民是最深厚的底气、最坚强的支撑,唯物史观强调充分发挥人民的主观能动性。“只要坚定信心、同舟共济、科学防治、精准施策,我们就一定能打赢疫情防控阻击战”。正月初一,中共中央政治局常务委员会召开会议,对疫情防控特别是患者治疗工作进行再研究、再部署、再动员。在这场万众一心、众志成城的疫情防控阻击战中,一方面党中央迅速成立应对疫情工作领导小组,“制度合力” 推动疫情防控工作协同配合,另一方面全国各地充分激发蕴藏于人民之中的力量,热爱人民、尊重人民、依靠人民,上接“天线”、下接“地气”,用最生动、最直接、最有效、最广泛的方式,守护人民健康,坚决打赢疫情防控阻击战。

为解决这些问题,微软(亚洲)互联网工程院语音团队联合浙江大学提出了一种新的机器学习模型 FastSpeech,并在论文《FastSpeech:快速、强大且可控的文本-语音模型》中详细介绍了该模型。另外,值得一提的是,该论文已被温哥华 NeurIPS 2019 会议录用。

王滨董事长指出,2020年是全面建成小康社会和“十三五”规划收官之年,也是推动重振国寿由开局起势转向攻坚突破的关键之年。2020年工作总体思路是坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻落实党的十九大和十九届二中、三中、四中全会精神和中央经济工作会议精神及十九届中央纪委四次全会精神,坚持党建引领,坚持稳中求进工作总基调,坚持新发展理念,坚持改革创新,坚持高质量发展,强化价值创造,推进公司治理现代化,确保“三转、四型、三化”战略思路和“两步走”战略部署取得实质性进展,为建设国际一流金融保险集团奠定坚实基础。

汇爱心,让官方力量和民间驰援共赋能。此次疫情防控形势复杂严峻,湖北省、浙江省各地医院不同程度出现医用防护服、外科口罩、一次性手术服紧缺问题,供需矛盾突出。社会各界迅速行动、捐资捐物,汇聚八方爱心,江苏、浙江、上海等地紧急医疗专家团队,随车携带防疫药品、防护服、口罩等防疫物资驰援武汉。阿里、腾讯、恒大、万科等企业纷纷响应,加入抗击新型肺炎驰援队伍,开展成立专项基金、捐赠医疗物资、成立防疫物资采购小组各类行动。更有社会上涌现的热心市民、爱心侨胞为这场无声的战役贡献自己的力量,一箱箱口罩,一笔笔汇款,凝聚着善意,传递着信心,深藏功与名。

4丨广东:公共场所不戴口罩将被处罚

艰难困苦,玉汝于成。纵有乱云飞渡、风吹浪打,我们坚信,14亿人的力量汇聚在一起,同呼吸、共奋斗、齐攻坚,就没有战胜不了的风浪,没有阻击不了的疫情。这个春节有点冷,但是一切会过去的,春暖花会开,花开都是爱。(蓝炜)

据人民日报,武汉大学中南医院感染科教授桂希恩表示:“我们控制SARS病毒花了6个月,我预计新型冠状病毒完全能控制而且比控制SARS快!目前新的确诊患者一天比一天多,但从顶峰到下降应该不需要太长时间,发病率“转弯”可以以周计算,预计正月十五前武汉市的疫情可能出现回落。”

一是一以贯之推进党的建设新的伟大工程,凝聚起重振国寿的强大力量。王滨董事长指出,要始终坚持党的领导,坚决做到“两个维护”,不断把学习贯彻习近平新时代中国特色社会主义思想引向深入,切实巩固“不忘初心、牢记使命”主题教育成果,锻造坚强有力的基层党组织,坚定不移全面从严治党。

在当下,基于神经网络的端到端文本-语音合成技术发展迅速,大多数模型的合成方法为:从文本生成梅尔谱(Mel-Spectrogram,即一种展示声音功率的光谱图),然后使用声码器(分析和合成语音信号的编解码器)合成语音。

据中新网,记者26日从四川航空获悉,装载有日本民间捐助的100万只防疫口罩的3U8086“东京-成都”川航航班已抵达成都双流国际机场,目前物资正通过汽运紧急驰援武汉。当前,国内新型冠状病毒感染的肺炎疫情防控形势十分严峻,口罩等防疫物资在疫区出现短缺情况。川航相关负责人介绍,川航日前得到准确消息,日本国际友人将捐赠一批防疫口罩,川航物流立即承接了此项运输任务,及时安排物资搭载川航3U8086“东京-成都”航班抵蓉。

与其他文本-语音模型相比,FastSpeech 模型架构较为独特,且有着更佳的性能(其梅尔谱生成速度比基线快 270 倍,语音生成速度比基线快 38 倍)。不仅如此,它还能够避免了单词跳过等错误,还支持精细调整语速和单词中断。

桂希恩:预计正月十五前武汉市疫情可能现“拐点”

为全面贯彻当前疫情防控工作的决策部署,全力支持企业健康稳定发展,切实降低疫情一级响应对企业运行的影响,维护南京土地市场健康平稳运行,经报请南京市政府批准,南京市规划和自然资源局发布了《关于疫情期间土地出让合同履行有关事项的通知》(以下简称《通知》)。

简单来讲,由于音素序列的长度总是小于梅尔谱序列长度,一个音素对应多个梅尔谱。而长度调节器会根据持续时间,扩展音素序列以匹配梅尔谱序列长度(一个补充时长预测器组件确定一个音素的时长)。 增加或减少与音素或音素持续时间匹配的梅尔谱数目,可成比例地调整语音速度。

对于受本次疫情影响未能按期交地、开工、竣工的,疫情一级响应期间均不计入违约期。

2019年,中国人寿制定服务粤港澳大湾区建设、长三角一体化发展、东北振兴、西部大开发的方案,探索推进雄安新区、粤港澳大湾区战略布局,为“一带一路”海外项目提供风险保障超过100亿元;服务实体经济投资金额超过8800亿元,普惠型小微企业贷款余额965亿元;全面助力三大攻坚战,帮扶13万户、49.2万人脱贫,新增绿色投资签约规模164亿元,绿色信贷余额207亿元,提供环境风险保障21.7亿元,深入开展风险排查整治,推进风险、内控、合规三大体系建设,防范化解风险。

为严防新型冠状病毒感染的肺炎疫情,阻断可能的传染源和传播途径,市场监管总局、农业农村部、国家林草局决定,自本公告发布之日起至全国疫情解除期间,禁止野生动物交易活动。

雷锋网原创文章,。详情见转载须知。

据广东省卫生健康委员会消息,各公共场所经营者、管理者应当要求进入其场所的人员佩戴口罩后方可进入其经营的公共场所,并在场所入口处设置醒目、清晰的佩戴口罩的提示;对未佩戴口罩进入场所者应当予以劝阻,对不听劝阻的人员依据《中华人民共和国传染病防治法》和《公共场所卫生管理条例》的规定向相关主管部门报告,由各相关主管部门按照各自职责依法处理。阻碍突发事件应急处理工作人员执行职务,触犯《中华人民共和国治安管理处罚法》,构成违反治安管理行为的,由公安机关依法予以处罚;构成犯罪的,依法追究刑事责任。

更为重要的是,FastSpeech 包含长度调节器,可协调梅尔谱序列和音素序列(即感知度不同的声音单位)之间的差异。