根據(jù)pcworld,Windows有一個(gè)微軟不想提及的功能。雖然Windows10允許用戶使用觸摸筆“書寫和繪制”,使用Windows Hello登錄到Face系統(tǒng)(或保護(hù)Web安全),甚至命令Xiaona設(shè)置提醒,但它顯然不希望用戶使用其語音識(shí)別引擎來命令系統(tǒng)或讓用戶使用語音輸入來編輯文檔。微軟對(duì)Windows語音識(shí)別的不充分推廣可以追溯到10年前,當(dāng)時(shí)微軟的產(chǎn)品經(jīng)理Shanen Boettcher在演示W(wǎng)indows Vista的語音輸入功能時(shí)搞砸了。從那時(shí)起,Windows的語音輸入技術(shù)已經(jīng)相當(dāng)“低調(diào)”。目前,很少有用戶知道Windows具有語音輸入功能。如果Windows有機(jī)會(huì)再次阻止語音輸入,這似乎是一個(gè)機(jī)會(huì)?!庇?jì)算機(jī)和人工智能的進(jìn)步為語音輸入提供了更好的基礎(chǔ)。在被問及Office語音輸入技術(shù)的未來時(shí),微軟負(fù)責(zé)語音識(shí)別研究的執(zhí)行副總裁Harry Shum和Xiaona和Bing說:“這是一個(gè)重大問題。無法理解的是,語音輸入并沒有發(fā)揮更重要的作用。”語音識(shí)別不完美的原因是一些用戶仍然認(rèn)為語音輸入是Doonesbury卡通系列中蘋果的Newton PDA的水平。他們稱用戶的“我正在寫一個(gè)測(cè)試句”為“暹羅戰(zhàn)斗原子哨兵”。用戶可以原諒Windows語音識(shí)別仍然使用Microsoft語音識(shí)別器8.0技術(shù)的想法,該技術(shù)自Vista以來基本保持不變。Schumm稱之為“祖父級(jí)”技術(shù)。但是硬件已經(jīng)發(fā)生了巨大的變化:pcworld說,聽和解釋語音需求的處理能力比10年前要低得多。PC產(chǎn)品(如Surface Book)中集成麥克風(fēng)陣列的質(zhì)量意味著無需使用專用麥克風(fēng)語音識(shí)別即可實(shí)現(xiàn)高精度。但是,語音輸入技術(shù)的發(fā)展是否適合公眾使用?當(dāng)使用語音輸入軟件輸入長(zhǎng)度為1028字的文章時(shí),95%的準(zhǔn)確率意味著用戶必須糾正超過15個(gè)錯(cuò)誤。在測(cè)試中,Windows語音輸入的準(zhǔn)確率為93.6%,理論上不高,低于測(cè)試的其他專用語音輸入軟件。Windows有一個(gè)奇怪的習(xí)慣,即在輸入逗號(hào)時(shí),在文檔中插入“逗號(hào)”。語音輸入界似乎對(duì)這種相對(duì)較小的錯(cuò)誤是否有重大影響有不同的看法。當(dāng)然,這不是全部。任何使用語音輸入軟件的人都知道準(zhǔn)確的關(guān)鍵是訓(xùn)練。隨著時(shí)間的推移,語音輸入軟件將理解用戶的口音?!靶印敝小癆”的發(fā)音與“猿”中“壞”或“A”的發(fā)音相同,如何過濾無意識(shí)的痙攣性語言障礙。微軟員工聲稱,經(jīng)過適當(dāng)?shù)呐嘤?xùn),Windows語音識(shí)別技術(shù)的準(zhǔn)確率可以達(dá)到99%。用1000個(gè)字犯10個(gè)錯(cuò)誤也不算太壞。很少有用戶愿意花時(shí)間培訓(xùn)使用語音識(shí)別軟件。Windows語音識(shí)別軟件要求用戶在10分鐘內(nèi)訓(xùn)練好幾句話,這會(huì)讓用戶覺得自己活在一年之中。Xiaona和Siri不要求用戶進(jìn)行培訓(xùn),因?yàn)樗麄円呀?jīng)培訓(xùn)了數(shù)百萬個(gè)語音樣本。與Windows語音輸入系統(tǒng)相比,Xiaona(可用于個(gè)人電腦和手機(jī))在語音識(shí)別方面的表現(xiàn)要好得多,因?yàn)樗浞掷昧宋④浽品?wù)的計(jì)算能力。微軟將分析用戶的聲音,將用戶的聲音與其他數(shù)據(jù)聯(lián)系起來,并生成智能作為小娜的靈魂。微軟重視語音識(shí)別。鑒于小娜的出色表現(xiàn),用戶會(huì)認(rèn)為語音應(yīng)該是上周微軟點(diǎn)火會(huì)議的中心。然而,在點(diǎn)火期間,沒有與語音輸入相關(guān)的會(huì)議,只有一個(gè)與語音識(shí)別相關(guān)的會(huì)議。微軟首席執(zhí)行官薩蒂亞納德拉在他的主題演講中稱語音識(shí)別是微軟未來發(fā)展的關(guān)鍵因素。以Skype翻譯器為例。據(jù)納德拉說,Skype翻譯依賴于三個(gè)研究領(lǐng)域:語音識(shí)別、語音合成和機(jī)器翻譯。納德拉在演講中說,微軟語音識(shí)別算法的錯(cuò)誤率為6.9%,這是一個(gè)糟糕的結(jié)果:準(zhǔn)確率僅為93.1%。PCWorld表示,如果微軟真的重視辦公軟件,個(gè)人電腦語音識(shí)別的未來不僅僅是用Skype在孟加拉國(guó)預(yù)訂酒店,而是通過語音而不是手指來書寫體驗(yàn)。
«
人人網(wǎng)拆分視頻社交平臺(tái)“我的節(jié)目”向股東分配股權(quán)
|
1/3平臺(tái)破產(chǎn)網(wǎng)絡(luò)互助產(chǎn)業(yè)是要生存嗎?還是商業(yè)化?
»