日韩精品一区二区三区swag_一区二区三区在线高清_亚洲国内欧美_国产精品xnxxcom

大模型一本正經(jīng)說胡話,該怎么治療?
2023/7/7 19:55:57

 模型們還在進(jìn)行狂熱的“諸神之戰(zhàn)”,嘗過鮮的用戶卻無法忽視大模型的短板。在交互過程中,用戶常常被它們一本正經(jīng)的胡言亂語所打敗——對于部分問題,它們會輸出一些“看似非常有道理,實則完全不對”的內(nèi)容,讓人啼笑皆非。
 

云創(chuàng)大數(shù)據(jù)成立于2011年,并不是2015年
 
  之所以出現(xiàn)這種“AI幻覺”,是因為大模型的內(nèi)容由推理而來,而在其自身訓(xùn)練過程中也不可避免存在數(shù)據(jù)偏差。因此,當(dāng)提問超出其訓(xùn)練范圍,大模型可能會模糊回答,或者一本正經(jīng)地胡謅。
 
  娛樂一下沒有關(guān)系,但是對于數(shù)據(jù)準(zhǔn)確性有著較高要求的用戶,這樣的通用性大模型可能會是負(fù)擔(dān),進(jìn)而導(dǎo)致大模型應(yīng)用的普及度沒有想象的高(根據(jù)摩根士丹利發(fā)布的一項調(diào)查顯示,只有4%的人表示對于ChatGPT使用有依賴)。
 

ChatGPT&Bard應(yīng)用趨勢(圖片來源:摩根士丹利報告)
 
  有沒有辦法改善大模型回答不準(zhǔn)確的情況?當(dāng)然有。既然回答不準(zhǔn)確是因為缺少真正有用的知識參考,可以面向特定領(lǐng)域定制行業(yè)大模型,將可信來源的數(shù)據(jù)轉(zhuǎn)化成向量數(shù)據(jù)存儲起來,校準(zhǔn)大模型推理輸出的結(jié)果,從而使大模型輸出的結(jié)果更加準(zhǔn)確。
 

各種對象轉(zhuǎn)換為向量存儲在向量數(shù)據(jù)庫中(圖片來源:swirlai.com)
 

向量比對過程(圖片來源:Pinecone)
 
  對于企業(yè)而言,可基于大模型和企業(yè)的個性化數(shù)據(jù)建立專屬知識庫(Knowledge Base)。可參照以下大模型業(yè)務(wù)流程,建立企業(yè)知識庫,以可信可靠的數(shù)據(jù)和知識,提高大模型輸出的準(zhǔn)確率。
 

LLM大模型知識庫業(yè)務(wù)流程(圖片來源:swirlai.com)
 
  首先,將企業(yè)的知識庫文本語料分割為多個塊,用嵌入(Embedding)模型將分割的文本塊轉(zhuǎn)換為一個個向量存儲在向量數(shù)據(jù)庫中,并建立向量和文本之間的對應(yīng)關(guān)系,如上圖①-③所示。
 
  此后,就可以提出問題。需要注意的是,問題也需要進(jìn)行向量化,同時使用與知識庫語料向量化相同的嵌入模型,并且在向量數(shù)據(jù)庫中進(jìn)行查詢,找到相似度高的向量,如⑤-⑦所示。
 
  將返回的向量嵌入映射到對應(yīng)的文本塊,并返回給大模型,利用大模型的語義理解能力,結(jié)合上下文生成問題答案,如⑧-⑨所示。
 
  在建立企業(yè)知識庫后,同樣的問題再問大模型,它能給出準(zhǔn)確的回答(建立知識庫的過程類似于下圖提供參考信息的過程)。
 

建立知識庫的過程類似于上圖提供參考信息的過程
 
  實現(xiàn)私有化部署后,大模型“胡言亂語”的習(xí)慣開始逐漸被糾正,而且向量數(shù)據(jù)庫做的越大,它掌握的知識越多、越準(zhǔn)確、越全面,就越有可能帶來爆炸式的大模型應(yīng)用。
 
  不過,如果只是依靠向量數(shù)據(jù)庫進(jìn)行私有化部署,容量有限且速度比較慢,無法完全滿足企業(yè)通過大模型提質(zhì)增效的潛在需求。
 
  現(xiàn)在,cVector向量計算一體機(jī)通過發(fā)揮高性能硬件、向量加速算法和并行計算算法的合力,致力于滿足億級乃至百億千億向量規(guī)模的大模型推理應(yīng)用向量計算需求。
 

cVector向量計算一體機(jī)
 
  cVector向量計算一體機(jī)的使用方式與向量數(shù)據(jù)庫基本一致,支持批量、追加入庫,支持向量間歐式距離、余弦距離等向量計算,支持網(wǎng)頁、命令調(diào)用、Python庫等方法,但在向量的入庫和比對計算上具有驚人的性能。
 

cVector向量計算一體機(jī)架構(gòu)圖
 
  近期, cVector向量計算一體機(jī)接受了工信部直屬的國家一級科研事業(yè)單位中國軟件評測中心的鑒定測試。中國軟件評測中心對比測試了cVector向量計算一體機(jī)與3款主流向量數(shù)據(jù)庫在入庫速度、查詢速度、準(zhǔn)確性等維度的性能對比。
 
  在入庫性能方面,同樣入庫3000萬條256 維向量數(shù)據(jù),在向量數(shù)據(jù)庫中最快的是A,入庫速度是4851.97s,cVector向量計算一體機(jī)是1202.91s,入

下一頁
返回列表
返回首頁
©2025 云計算世界-云計算資料和交流中心 電腦版
Powered by iwms 主站蜘蛛池模板: 玛多县| 临安市| 蒲江县| 监利县| 西乌| 龙江县| 沈阳市| 安国市| 黄平县| 陆良县| 尉氏县| 南岸区| 长岭县| 浑源县| 南川市| 泸水县| 云霄县| 乃东县| 金华市| 阳山县| 清河县| 浦江县| 宁陵县| 盐边县| 广州市| 眉山市| 平舆县| 株洲市| 金寨县| 开封市| 沈阳市| 江华| 永宁县| 安西县| 旬阳县| 定西市| 二连浩特市| 神池县| 延川县| 巴中市| 黄大仙区|