ChatGPT一本正經地胡說八道,需要智者仔細確認答案是否正確
「什麼是人工智慧?」曲博士說,「人工智慧不是人類用電腦模擬人腦,而是一種資料分析技術,以及資料統計的方法。」打破大部分人認為,人工智慧是電機工程領域或資訊工程領域的範疇,但實際上是一種資料分析技術與統計,在人工智慧的時代,對科技一定要有20%的了解,這20%的深度為自學科技門檻(Knowledge tipping point),對各種科技需要有一點基本的認知,才能對相關的資訊有感。
更進一步解釋,其實就是以大腦學習來比照人工智慧的學習方式,人工智慧可分成「訓練(Training)與學習(Learning)」以及「推論(Inference)與預測(Prediction)」兩階段。人類的資料是透過大腦經由眼耳鼻舌皮膚收集大量的數據與經驗儲存認知,科學家在訓練電腦,則是將大量資料輸入電腦,前者有意識,後者則無。因此,人工智慧的訓練是非常昂貴與花時間,ChatGPT訓練一次需要一千萬美金,然而人工智慧建構後的推論只需一瞬間,10秒內呈現預測結論,爆發力驚人。
人工智慧模型中的生成式(Generative)的分類,並非簡單分析已有的數據,而是更深度的學習數據中的機率分佈,根據已有的數據進行分析後創造生成全新的內容,主要應用包括內容創作、基礎科學研究、人機交互、文案寫作、文字轉圖片、智能配音、海報生成、智能特效、代碼生成及醫療診斷等。
生成式預訓練變換模型(GPT: Generative Pre-trained Transformer)的語言模型,就是使用深度學習讓電腦產生人類聽懂的自然語言,生成式(Generative)代表它會重新排列組合舊的文字生成新的句子;預訓練(Pre-trained)代表它必須事先輸入大量資料訓練產生語料庫(Text corpus);變換模型(Transformer)指的是2017年由Google大腦團隊所推出的GPT前幾代模型。
企業對AI的應用為何?怎麼跟機器人溝通?
讓電腦聽得懂人類說的話,就要建構在語言學上大量的文章資料,完整的語料庫(Text corpus),記錄詞彙之間的相關性,聊天機器人,代寫學術論文、代讀報告選股、代回客服信函、代工程師寫程式,而且中英文都通,未來的語系就看世界各國投入AI世界的速度與資本。
預料未來企業內每一位工程師都是提示(Prompt)工程師,電腦會以我們輸入的文字做為提示,到資料庫裡把之前輸入一大堆人類的文字或話語中計算機率重新排列組合,選擇機率最高的文字拼湊出一個字句輸出,這個過程自始至終電腦都是無意識的進行數學計算機率而已,並非讓我們錯覺的以為電腦知道人類在說什麼,這個結果肯定是没有靈魂的。
聊天機器人好像聽得懂我的意思
很多人在和ChatGPT聊天後,覺得這個回答太貼切了,就會誤以為它具有思考能力,且聽懂自己在說什麼,曲建仲強調,「事實上完全不是這樣!」他解釋,ChatGPT是利用人類詢問的問題找出特徵,利用特徵到資料庫中尋找適合的關鍵字,再運用機率計算出最適合的回覆。曲建仲幽默地說道:「很多時候我們都以為它聽懂了,其實他從頭到尾都沒有聽懂。」
即使ChatGPT無法真正聽懂人類的問題,人工智慧仍在未來扮演極度重要的角色,無論是陪人聊天的APP或電話客服等,都是未來兩、三年的產業趨勢。雖然人工智慧將帶來生活上的便捷,曲建仲仍擔憂地表示,「這個對人類來說是蠻大的影響。」因人工智慧倚靠數據機率再由文字的形式回覆,可能會導致錯誤訊息於網路上流傳,ChatGPT一本正經地胡說八道,需要智者仔細確認答案是否正確,因此正確運用人工智慧成為關鍵。
值得一提的是,人工智慧生成圖像工具Midjourney作畫,參加Fine Arts Exhibition數位藝術競賽奪得首獎,人工智慧自編自導自演的影片,受人爭議的深度偽造(Deepfake)技術等,其中的真真假假,再度考驗企業隨時代變革建立自身的AI超級大腦系統同時,在生成式資料檢索(GIR: Generative Information Retrieval)對封閉型或開放型的資料安全保護,數位助手的優化與AI應用的精準品質等,更費心力。