語意理解

文本語意分析將在2020年創造64億美元市場

[Allied Market Research, 2015]

深度學習

預計將在2025年創造102億美元的市場

[Grand View Research, 2017]

語意理解

語意理解技術是眾多相關AI應用服務系統(如:虛擬助理、語意搜尋、文本生成...等)的核心關鍵技術,它可自動理解字串在文章中的語意類別。譬如:可以知道句子〝XC60搭載的City Safety都會安全防護系統。此外,越來越多手機可無線充電〞其中,〝City Safety都會安全防護系統〞和〝無線充電〞這兩字串分別代表「規格」和「功能」的語意概念。

傳統語意理解技術研發過程多經三階段(1)人工標記語料庫(2)語意理解模組建立(3)錯誤分析。藉由錯誤分析結果,不斷回饋與進行模組修正,而人工標記語料庫佔了所有研發過程幾乎95%以上的時間與人力。

AI Clerk語意理解模組強調只需人工標記小量語料,可自動擴充標記語料。以3C類商品文本語意理解進行實驗評估,發現減少99.5%以上人工蒐集和標記語料的時間,便可達到與以人工標記語料為基底所建立之模組相抗衡的結果;實驗比對加上自動擴充語料的模組,其效能甚至可能超越僅以純人工標記語料所建立之模組。

相關應用>> 智慧櫃姐

深度學習

深度學習(Deep Learning)為基於類神經網路(Neural Network)理論和學習資料表徵(Learning Data Representations)為基礎的機器學習 (Machine Learning)一分支。因AlphaGo大勝世界棋王,此役除了讓AlphaGo一戰成名,更提升了大眾對深度學習技術之能耐的信賴與關注。深度學習中如時間遞歸神經網絡(Recurrent Neural Network, RNN)、卷積神經網路(Convolutional Neural Network, CNN)...等,廣泛應用於AI Clerk的技術研發中。


雲端運算

AI Clerk透過雲端運算(Cloud Computing)加速運算,並以Software as a Service方式得供各智慧服務的結果。


大數據分析

在具大量(Volume)、快速(Velocity)、多樣性(Variety)、多變性(Variability)與真實性(Veracity) 的巨量資料中,AI Clerk嘗試利用機器學習、資料探勘或自然語言 處理等方法,分析出額外的資訊以及資訊間的關聯,企圖建立各式輔助決策支援系統,創造商業價值。


自然語言處理

自然語言處理屬人工智慧和語言學領域的分支研究領域,目的在於讓電腦瞭解人類的語言。自然語言處理和語言學領域的計算語言學(Computational Linguistics)有相當多重疊處。 自然語言處理的典型任務,如:

  • 問答系統(Question Answering):智慧回覆,如:諮詢「智慧櫃姐」可獲得即時個人化商品推薦結果。
  • 語意理解(Language Understanding)、語意標記(Concept Labeling):自動理解字串在文章中的語意類別。譬如:可以知道句子〝越來越多手機可無線充電〞中的〝無線充電〞所表達的是一種「功能」的概念。
  • 關鍵詞擷取(Keyword Extraction):擷取出文章的關鍵詞,提供友善、快速瀏覽與篩選文章。
  • 自動文本分類(Text Classification):將文章自動歸屬於某類別。譬如:可將〝我的Galaxy Note 7竟然爆炸了〞這樣的內容自動分類到「抱怨類文章」。
  • 文本分群(Text Clustering):群聚相似文章。譬如:將來自不同媒體所發佈有關〝iPhone X〞的報導內容,自動判對屬於同一主題系列報導。
  • 錯誤校正(Error Correction):校正輸入錯誤的字串。譬如:可將〝我喜歡透過手機學之事〞自動修正為〝我喜歡透過手機學知識〞。
  • 語言模組(Language Model):經由已知字串預測出下一個可能出現的字詞。譬如:當輸入〝我想買適合玩遊〞的字串,系統預測出下一個想要輸入的中文字可能是〝戲〞。
  • 語意關係擷取(Relation Extraction):得以理解文本中兩個字串之間的語意關係。譬如:可識別 〝我認真覺得 iPhone X 比小米好搶〞 這句話中〝iPhone X〞和〝小米〞這兩個字串是拿來被「比較」的。
  • 文本生成(Text Generation):給予部分資訊,自動生成完整句子或文章。
...等

相關應用>> 智慧櫃姐

機器學習

機器學習從資料數據中透過計算式統計(Computational Statistics)或論理方法建構演算法或模組以產生可信賴、可重複的決策和 預測結果。應用機器學習讓自然語言處理(Natural Language Processing, NLP)、語意理解(Language Understanding)、自動分類(Classification)、智慧推薦(Intelligent Recommendation)、影像辨 識(Image recognition)、文本生成(Text Generation)...等任務得以實現。


文本探勘

AI Clerk挑戰從非結構資料擷取出具語意訊息有意義的結構化資訊,挖掘出各資訊間的關連性。譬如:找出各文章中屬於各商品的型號、評論、功能等相對應之字串,並進一步找出其之間是否有關連。


©2018 ITRI. All rights reserved.