近日,國(guó)家知識(shí)產(chǎn)權(quán)局公開信息顯示,北京全科在線科技有限責(zé)任公司提交了一項(xiàng)名為“基于大模型醫(yī)學(xué)會(huì)議內(nèi)容分析方法”的專利申請(qǐng),公開號(hào)為CN121842449A,申請(qǐng)時(shí)間為2025年12月。該專利聚焦人工智能技術(shù)在醫(yī)學(xué)會(huì)議場(chǎng)景的應(yīng)用,旨在通過(guò)跨模態(tài)數(shù)據(jù)處理提升會(huì)議內(nèi)容轉(zhuǎn)錄的準(zhǔn)確性。
根據(jù)專利摘要,該方法通過(guò)同步采集醫(yī)學(xué)會(huì)議的音頻流與視頻流,并為兩者標(biāo)記時(shí)間戳實(shí)現(xiàn)數(shù)據(jù)對(duì)齊。系統(tǒng)首先對(duì)音頻進(jìn)行語(yǔ)音識(shí)別生成初步文本,同時(shí)從視頻中提取與模糊實(shí)體時(shí)間戳對(duì)應(yīng)的關(guān)鍵幀。通過(guò)建立聲學(xué)相似度與語(yǔ)境相關(guān)性的校準(zhǔn)機(jī)制,系統(tǒng)將語(yǔ)音識(shí)別中的候選模糊實(shí)體與視覺(jué)實(shí)體池中的高置信度實(shí)體進(jìn)行匹配,當(dāng)匹配分?jǐn)?shù)達(dá)到預(yù)設(shè)閾值時(shí),自動(dòng)用視覺(jué)實(shí)體修正文本中的錯(cuò)誤內(nèi)容。這一技術(shù)路徑有效解決了醫(yī)學(xué)專業(yè)術(shù)語(yǔ)識(shí)別中因發(fā)音相似或語(yǔ)境復(fù)雜導(dǎo)致的誤差問(wèn)題。
公開資料顯示,北京全科在線科技有限責(zé)任公司成立于2008年,注冊(cè)資本1000萬(wàn)元,主營(yíng)業(yè)務(wù)涵蓋科技推廣與應(yīng)用服務(wù)領(lǐng)域。通過(guò)天眼查平臺(tái)查詢可知,該公司目前擁有19項(xiàng)專利信息、2條商標(biāo)注冊(cè)記錄,并持有6項(xiàng)行政許可。在商業(yè)拓展方面,企業(yè)已對(duì)外投資3家子公司,參與過(guò)5次招投標(biāo)項(xiàng)目,展現(xiàn)出較強(qiáng)的技術(shù)轉(zhuǎn)化與市場(chǎng)開拓能力。
值得關(guān)注的是,該專利提出的跨模態(tài)校準(zhǔn)機(jī)制突破了傳統(tǒng)語(yǔ)音識(shí)別技術(shù)的局限,通過(guò)融合視覺(jué)信息與音頻數(shù)據(jù),構(gòu)建了多維度語(yǔ)義理解框架。尤其在醫(yī)學(xué)會(huì)議場(chǎng)景中,專業(yè)術(shù)語(yǔ)的準(zhǔn)確轉(zhuǎn)錄對(duì)后續(xù)知識(shí)整理與傳播至關(guān)重要,這項(xiàng)技術(shù)有望為醫(yī)療行業(yè)提供更高效的內(nèi)容處理解決方案。
市場(chǎng)分析人士指出,隨著人工智能技術(shù)在垂直領(lǐng)域的深度滲透,具備行業(yè)數(shù)據(jù)理解能力的技術(shù)方案將更具競(jìng)爭(zhēng)優(yōu)勢(shì)。北京全科在線此次申請(qǐng)的專利,既體現(xiàn)了企業(yè)在AI醫(yī)療領(lǐng)域的持續(xù)投入,也反映出市場(chǎng)對(duì)精準(zhǔn)化內(nèi)容處理工具的迫切需求。不過(guò)需提醒的是,專利技術(shù)從申請(qǐng)到實(shí)際商用仍需經(jīng)歷多重驗(yàn)證,投資者應(yīng)保持理性判斷。























