大模型與人工智能區別:以前的模型大都是弱人工智能,像阿爾法狗只能下圍棋,而各種識別產品也只能完成一個任務。這些模型之間是隔離的不能互相支撐。而大模型則通過擴大模型的參數規模,并通過大量數據的訓練,來支撐所有人工智能的任務。
大模型就是一種參數規模非常大的人工神經網絡。因為參數足夠大之后它能力非常強,所以在很多任務上都表現出非常好的能力。
因為大模型學習了非常多的知識,經過了非常多的數據訓練,這樣就具有了非常好的通用性。包括像我們日常生活中經常見到的各種人工智能產品,比如說人臉識別、對話機器人,等等。
因為大模型的容量非常大、能力非常強,所以它把所有的任務都合在一起,用一個模型來提供非常多的任務的支撐,就是我們人工智能這個領域所謂的通用人工智能,所以它展示出來通用人工智能一個非常好的前景。
人工智能大模型的類型
大模型可以分為兩類,通用大模型和垂直大模型。通用大模型,基礎大模型,擅長處理多種任務,是行業技術的制高點,推動產業革命。如GPT系列就是通用模型。訓練通用大模型的參數規模大,需要強大的算力支撐,通常是頭部企業的兵家必爭之地。
國內科技、互聯網巨頭紛紛布局,百度的文心一言、阿里的通義千問大模型、騰訊的混元大模型、科大訊飛的星火認知大模型、商湯科技的日日新大模型等都是。
垂直大模型,行業大模型,是大模型應用落地的重要形式。基于通用大模型進行微調,通過訓練專業數據,向各行各業等多個場景提供更加精準、高效的解決方案。比如華為盤古大模型就是針對行業提供專業大模型,已經初步運用在政務、金融、鐵路、氣象、煤礦等領域。
國際上,除了ChatGPT外,還有Llama2,是Meta與微軟聯手推出的開源大模型,包含70億參數、130億參數、700億參數三個規模;其訓練數據快速增加,接受了2萬億tokens的訓練。
推薦閱讀: