“這是我們新推出的AI辦公本。得益于人機(jī)智能交互語音系統(tǒng),即便在遠(yuǎn)距離或嘈雜環(huán)境中,它也能清晰拾音,實(shí)現(xiàn)高識(shí)別率。”前不久,思必馳科技股份有限公司的“人機(jī)智能交互語音系統(tǒng)”入選了“2025蘇州十大產(chǎn)業(yè)科技成果”,公司產(chǎn)品總監(jiān)王艷龍向記者展示了應(yīng)用該系統(tǒng)的兩項(xiàng)創(chuàng)新產(chǎn)品“AI辦公本”和“無感擴(kuò)聲吸頂麥”。
賦予機(jī)器類人的溝通能力
何為“人機(jī)智能交互語音系統(tǒng)”,其核心在于賦予機(jī)器類人的溝通能力。
思必馳“人機(jī)智能交互語音系統(tǒng)”基于其全鏈路智能對話平臺(tái)和語言計(jì)算大模型,攻克了復(fù)雜噪聲環(huán)境下的高精度識(shí)別、多輪全雙工對話等關(guān)鍵技術(shù)難題,性能達(dá)到國際領(lǐng)先水平,已廣泛應(yīng)用于汽車、家居、辦公、教育等領(lǐng)域。
該系統(tǒng)融合了信號處理、語音識(shí)別、大模型、語音合成等多項(xiàng)單點(diǎn)技術(shù),思必馳則會(huì)根據(jù)不同產(chǎn)品的研發(fā)需求靈活應(yīng)用這些技術(shù)模塊。例如去年4月發(fā)布的“AI辦公本”,便是這樣一款面向辦公會(huì)議場景的軟硬件一體化產(chǎn)品。王艷龍介紹,這款產(chǎn)品不僅支持流暢手寫,能呈現(xiàn)彩色類紙效果,還可以自動(dòng)記錄會(huì)議內(nèi)容、進(jìn)行語音轉(zhuǎn)寫、智能提煉重點(diǎn),并具備圖像拍照功能。此外,它還支持安裝騰訊會(huì)議、微信讀書、釘釘?shù)鹊谌綉?yīng)用,打破了同類產(chǎn)品的功能局限。
“無感擴(kuò)聲吸頂麥”同樣是該系統(tǒng)的創(chuàng)新結(jié)晶,性能不僅比肩國際知名品牌的產(chǎn)品,甚至更具競爭力。其內(nèi)置128個(gè)數(shù)字麥克風(fēng),運(yùn)用AI算法進(jìn)行擴(kuò)聲,能在三四十平方米區(qū)域內(nèi),將每個(gè)位置的人音自然放大,真正實(shí)現(xiàn)無感擴(kuò)聲的同時(shí)還能進(jìn)行會(huì)議記錄。“思必馳人機(jī)智能交互語音系統(tǒng)不僅為萬物互聯(lián)時(shí)代的人機(jī)交互提供了中國方案,更實(shí)現(xiàn)了真正的智能化。”王艷龍表示。
部分產(chǎn)品持續(xù)更新迭代近100個(gè)版本
思必馳在軟硬件結(jié)合的人工智能技術(shù)與產(chǎn)品服務(wù)領(lǐng)域深耕多年,于聲音信號處理、語音識(shí)別、大模型等方面已有深厚的算法積累與數(shù)據(jù)積累,這為產(chǎn)品研發(fā)奠定了穩(wěn)固的基礎(chǔ)。
“面對相應(yīng)領(lǐng)域發(fā)展百年的國際品牌,我們的目標(biāo)絕非追隨,而是實(shí)現(xiàn)真正的突破與創(chuàng)新。”王艷龍以服務(wù)的復(fù)旦大學(xué)為例,該校此前長期受困于擴(kuò)音效果和錄播課程中的雜音問題,傳統(tǒng)廠商數(shù)十年未能解決。而思必馳選擇了全新的技術(shù)路徑,用軟件算法破局——利用少量數(shù)據(jù),就能通過模型和軟件的升級從而有效解決。他表示,無感擴(kuò)聲和錄播降噪對整個(gè)教育領(lǐng)域而言都是新的突破點(diǎn)。
產(chǎn)品持續(xù)迭代創(chuàng)新也是思必馳的堅(jiān)持。“用戶可能只感受到一點(diǎn)點(diǎn)提升,這背后卻是我們投入大量資源進(jìn)行技術(shù)優(yōu)化的結(jié)果。”王艷龍透露,如發(fā)布了近一年半的“無感擴(kuò)聲吸頂麥”,至今已更新了近100個(gè)軟件版本。他表示,每更新一個(gè)版本都需要不斷進(jìn)行數(shù)據(jù)補(bǔ)充、模型優(yōu)化、算法優(yōu)化、工程優(yōu)化等,一整套下來需要很多精力;但想讓一個(gè)產(chǎn)品從90分到99分甚至100分,并沒有什么捷徑,只能依靠長時(shí)間的專注投入、創(chuàng)新突破。
王艷龍還補(bǔ)充,每個(gè)產(chǎn)品的打造都離不開團(tuán)隊(duì)協(xié)作。“單無感擴(kuò)聲吸頂麥這一個(gè)產(chǎn)品,思必馳就投入了幾十人的團(tuán)隊(duì),涉及硬件工程師、軟件工程師、算法測試工程師等多個(gè)崗位。”他說,“為了確保極高的品質(zhì),我們的工程師甚至?xí)诠S駐扎一兩個(gè)月,只為解決一個(gè)細(xì)微問題、提升一點(diǎn)效果。”
多項(xiàng)技術(shù)指標(biāo)全球領(lǐng)先
目前,思必馳對“人機(jī)智能交互語音系統(tǒng)”的研發(fā)與應(yīng)用已相當(dāng)深入。據(jù)悉,思必馳在汽車、家電領(lǐng)域均布局近十年,在新能源汽車領(lǐng)域的語音交互產(chǎn)品市場占有率為第一;而對辦公會(huì)議產(chǎn)品的研發(fā)也已持續(xù)五年。“我們在多項(xiàng)技術(shù)指標(biāo)上全球領(lǐng)先。比如說辦公會(huì)議無感擴(kuò)聲這個(gè)場景下,思必馳的吸頂麥對聲音處理的延遲約為25毫秒,擴(kuò)能高達(dá)12-15DB。”王艷龍說,在該場景下的擴(kuò)能可以突破10DB的,目前全球范圍內(nèi)只有思必馳一家。
應(yīng)用思必馳“人機(jī)智能交互語音系統(tǒng)”的產(chǎn)品,往往具有眾多創(chuàng)新功能,因而在全球市場具備領(lǐng)先優(yōu)勢和廣闊空間。
在進(jìn)行產(chǎn)品推廣方面,思必馳也很有一套、推出“無感擴(kuò)聲吸頂麥”時(shí),思必馳就在某全球IT巨頭的培訓(xùn)教室里進(jìn)行了近六個(gè)月的各類測試驗(yàn)證,最終在一眾國際品牌中脫穎而出。“客戶選擇我們,其實(shí)就是因?yàn)槲覀兊漠a(chǎn)品性能指標(biāo)過硬、效果卓越,同時(shí)我們的服務(wù)足夠好。”王艷龍總結(jié)道。
對于此次思必馳“人機(jī)智能交互語音系統(tǒng)”入選“2025蘇州十大產(chǎn)業(yè)科技成果”,團(tuán)隊(duì)深受鼓舞:“思必馳每年都會(huì)推出一到兩款突破性的產(chǎn)品。接下來我們還會(huì)繼續(xù)保持這個(gè)節(jié)奏,不斷應(yīng)用AI技術(shù)推出創(chuàng)新成果,引領(lǐng)細(xì)分領(lǐng)域發(fā)展。”