2023年2月7日 星期二

Chat GPT

Chat GPT
H:據非凡新聞節目說明,目前已有一億人員使用。20230206W1

維基百科介紹:
Chat GPT是由OpenAI開發的一個人工智慧聊天機器人程式,於2022年11月推出。該程式使用基於GPT-3.5架構的大型語言模型並透過強化學習進行訓練。 維基百科

首次發行日期: 2022 年 11 月 30 日

網站: openai.com/blog/chatgpt/

ChatGPT目前仍以文字方式互動,而除了可以透過人類自然對話方式進行交互,還可以用於相對複雜的語言工作,包括自動文本生成、自動問答、自動摘要等在內的多種任務。如:在自動文本生成方面,ChatGPT可以根據輸入的文本自動生成類似的文本,在自動問答方面,ChatGPT可以根據輸入的問題自動生成答案。還具有編寫和調試計算機程序的能力。[2] 在推廣的期間中,所有人可以免費註冊,並在登入後後免費使用 ChatGPT 實現與 AI 機器人對話。[3]

ChatGPT因其在許多知識領域給出詳細的回答和清晰的答案而迅速獲得關注,但其事實準確性參差不齊被認為是一重大缺陷[4]。ChatGPT於2022年11月發布後,OpenAI估值已漲至290億美元[5]。上線兩個月後,用戶數量達到1億[6]。

訓練

ChatGPT 使用監督學習和強化學習在 GPT-3.5 之上進行了微調。[7]

ChatGPT使用基於人類反饋的強化學習進行訓練,這種方法通過人類干預以增強機器學習的效果,從而獲得更為逼真的結果。[8]其使用基於GPT-3.5架構的語言模型。 [9]在訓練過程中,人類訓練師扮演着用戶與人工智能助手的角色。模型在Microsoft Azure的超級計算機上訓練,並通過近端策略優化算法(proximal policy optimization)進行微調。[10]這種策略優化算法比信任域策略優化(trust region policy optimization)算法更為高效。[11]