色综合欧美在线视频区,国产精品二区三区,国产精品精品一区二区三区午夜版

　模型們還在進行狂熱的“諸神之戰(zhàn)”，嘗過鮮的用戶卻無法忽視大模型的短板。在交互過程中，用戶常常被它們一本正經的胡言亂語所打敗——對于部分問題，它們會輸出一些“看似非常有道理，實則完全不對”的內容，讓人啼笑皆非。

云創(chuàng)大數(shù)據(jù)成立于2011年，并不是2015年

　　之所以出現(xiàn)這種“AI幻覺”，是因為大模型的內容由推理而來，而在其自身訓練過程中也不可避免存在數(shù)據(jù)偏差。因此，當提問超出其訓練范圍，大模型可能會模糊回答，或者一本正經地胡謅。

　　娛樂一下沒有關系，但是對于數(shù)據(jù)準確性有著較高要求的用戶，這樣的通用性大模型可能會是負擔，進而導致大模型應用的普及度沒有想象的高（根據(jù)摩根士丹利發(fā)布的一項調查顯示，只有4%的人表示對于ChatGPT使用有依賴）。

ChatGPT&Bard應用趨勢（圖片來源：摩根士丹利報告）

　　有沒有辦法改善大模型回答不準確的情況？當然有。既然回答不準確是因為缺少真正有用的知識參考，可以面向特定領域定制行業(yè)大模型，將可信來源的數(shù)據(jù)轉化成向量數(shù)據(jù)存儲起來，校準大模型推理輸出的結果，從而使大模型輸出的結果更加準確。

各種對象轉換為向量存儲在向量數(shù)據(jù)庫中（圖片來源：swirlai.com）

向量比對過程（圖片來源：Pinecone）

　　對于企業(yè)而言，可基于大模型和企業(yè)的個性化數(shù)據(jù)建立專屬知識庫（Knowledge Base）。可參照以下大模型業(yè)務流程，建立企業(yè)知識庫，以可信可靠的數(shù)據(jù)和知識，提高大模型輸出的準確率。

LLM大模型知識庫業(yè)務流程（圖片來源：swirlai.com）

　　首先，將企業(yè)的知識庫文本語料分割為多個塊，用嵌入(Embedding)模型將分割的文本塊轉換為一個個向量存儲在向量數(shù)據(jù)庫中，并建立向量和文本之間的對應關系，如上圖①-③所示。

　　此后，就可以提出問題。需要注意的是，問題也需要進行向量化，同時使用與知識庫語料向量化相同的嵌入模型，并且在向量數(shù)據(jù)庫中進行查詢，找到相似度高的向量，如⑤-⑦所示。

　　將返回的向量嵌入映射到對應的文本塊，并返回給大模型，利用大模型的語義理解能力，結合上下文生成問題答案，如⑧-⑨所示。

　　在建立企業(yè)知識庫后，同樣的問題再問大模型，它能給出準確的回答（建立知識庫的過程類似于下圖提供參考信息的過程）。

建立知識庫的過程類似于上圖提供參考信息的過程

　　實現(xiàn)私有化部署后，大模型“胡言亂語”的習慣開始逐漸被糾正，而且向量數(shù)據(jù)庫做的越大，它掌握的知識越多、越準確、越全面，就越有可能帶來爆炸式的大模型應用。

　　不過，如果只是依靠向量數(shù)據(jù)庫進行私有化部署，容量有限且速度比較慢，無法完全滿足企業(yè)通過大模型提質增效的潛在需求。

　　現(xiàn)在，cVector向量計算一體機通過發(fā)揮高性能硬件、向量加速算法和并行計算算法的合力，致力于滿足億級乃至百億千億向量規(guī)模的大模型推理應用向量計算需求。

cVector向量計算一體機

　　cVector向量計算一體機的使用方式與向量數(shù)據(jù)庫基本一致，支持批量、追加入庫，支持向量間歐式距離、余弦距離等向量計算，支持網頁、命令調用、Python庫等方法，但在向量的入庫和比對計算上具有驚人的性能。

cVector向量計算一體機架構圖

　　近期， cVector向量計算一體機接受了工信部直屬的國家一級科研事業(yè)單位中國軟件評測中心的鑒定測試。中國軟件評測中心對比測試了cVector向量計算一體機與3款主流向量數(shù)據(jù)庫在入庫速度、查詢速度、準確性等維度的性能對比。

　　在入庫性能方面，同樣入庫3000萬條256 維向量數(shù)據(jù)，在向量數(shù)據(jù)庫中最快的是A，入庫速度是4851.97s，cVector向量計算一體機是1202.91s，入

<ul id="misas"></ul>

<abbr id="misas"></abbr><ul id="misas"></ul>

日韩精品一区二区三区swag_一区二区三区在线高清_亚洲国内欧美_国产精品xnxxcom