隨著物聯網時代的到來,智能語音交互將逐步成為人們生活中的「剛需」。智能語音系統的認知能力越來越強,它的用途越來越廣。
中國智能語音產業獲得了前所未有的發展。據中國報告大廳發布的報告預測,2015年,中國的語音市場規模為46.8億人民幣,比前一年增長53.1%,占世界的12%。
智能語音交互是基於語音輸入的新一代交互模式,通過說話就可以得到反饋結果。比如編輯稿子可以通過它來完成。相信通過智能語音產品功能的不斷完善,未來會有更實用的應用範圍。
剛參加完發布會就得趕路,編輯部又來催稿,怎麼辦?看著手頭的會議資料,記者王葉(化名)在心裡整理了一下思路,然後一手拉著行李箱,一手開始對著手機「說」稿子,一句句話被訊飛語音輸入法迅速地轉化成文字,形成文檔。從酒店到火車站再到火車上,王葉就靠著「對手機說」這個動作,在共計三個小時的時間內,「說」出了兩篇2000多字的稿件。
自從10月份出現在錘子發布會上後,訊飛語音輸入法突然變成「網紅」,像王葉一樣的用戶激增。11月2日下午宣布,其旗下訊飛輸入法的用戶數已突破4億,活躍用戶達1.1億,居世界中文輸入法第二位。
據科大訊飛方面稱,這款在2010年推出的輸入軟體,集語音、手寫、拼音等多種輸入方式於一體,語音識別準確率已超97%,按照微軟方面的標準,97%已經是世界前茅的準確率。
在11月2日媒體分享會上,訊飛輸入法負責人翟吉博稱,現在攬獲4億用戶的訊飛輸入法,當初僅是一個用時3天寫出的Demo(小樣)。
翟吉博表示,訊飛輸入法用戶數從0到4億的過程,背後是「產品為王」的理念以及對技術創新的追求。例如,訊飛輸入法很早就面向無網絡環境推出了離線語音輸入,不僅能在離線情況使用語音輸入,還能在複雜的網絡情況下自動切換在線和離線語音;針對方言口音,陸續加入粵語、四川話、東北話、上海話等近20種方言語音輸入。
值得一提的是,訊飛輸入法現在還加入了語種翻譯功能,用戶利用「隨聲譯」功能,可以直接轉譯中英、中日、中韓等語言。
儘管輸入法早已面市,但真正「走紅」卻是在今年10月錘子M1的新品發布會上。當時,錘子科技CEO羅永浩對著手機演示了一段「碎碎念」,不到一秒鐘的時間,就被訊飛語音輸入法轉換成了準確的文字。
「原先輸入法在蘋果商店的工具類排行榜上都是二十多名,發布會後就一直是第一名。日均下載量也是之前的四倍。」翟吉博告訴法治周末記者。
此外,訊飛開放平台合作夥伴總監陳其山也對訊飛開放平台的成長曆程進行了分享。他表示訊飛開放平台目前已經覆蓋8.9億終端,擁有21萬合作夥伴,日服務量達到30億次。
據介紹,語音識別結合機器翻譯的實用性很強。通過一些手機軟體,用戶能將多種外語以及我國少數民族語言的語音譯成漢語,在一些交流場合,不再需要翻譯人員的幫助。
根據中國工業和信息化部電子科技信息情報研究所數據顯示,2013年,全球智能語音產業規模整體達33.7億美元,同比增長38.1%;2014年較2013年同比增長41.0%,產業規模大幅提升。預計到2017年,全球智能語音產業規模將達112.4億美元,複合年均增長率達35.1%。
智能語音市場可以預期的好前景,引發了企業間激烈的爭奪。包括谷歌、蘋果、微軟等國際巨頭以及百度、阿里、騰訊也在不斷推出智能語音服務,在語音識別、語音合成等功能上提供了各種語音產品。
不過智能語音行業發展也有一些擔憂,業內人士分析稱,語音輸入的方式並不穩定,應用場景也有所局限,還要依賴良好的產業生態鏈,沒有技術的積累和長期大量的資本投入是堅持不到市場爆發的。