1.AI工具規(guī)劃能力的“高考”來(lái)了AI模型能否像人類一樣,在沒(méi)有明確指令的情況下熟練駕馭各種工具完成復(fù)雜任務(wù)?如今的AI已經(jīng)能寫(xiě)詩(shī)、畫(huà)畫(huà)、做簡(jiǎn)單數(shù)據(jù)分析,但真實(shí)世界的工作場(chǎng)景往往沒(méi)有清晰的"操作手冊(cè)"。比如金融分析師需要調(diào)用行情軟件、數(shù)據(jù)庫(kù)和統(tǒng)計(jì)工具才能完成報(bào)告,科研人員得協(xié)調(diào)實(shí)驗(yàn)室服務(wù)器、文獻(xiàn)數(shù)據(jù)庫(kù)和繪圖軟件才能整理實(shí)驗(yàn)結(jié)果。這些工作要求的不僅是"會(huì)用工具",更是"知道用什么工具、怎么用、按什么順序用"的...
2025-09-12 07:19:43 3462瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1.為什么需要CodeRAG技術(shù)?1.1現(xiàn)實(shí)世界代碼生成的困境當(dāng)前主流大語(yǔ)言模型(LLM,LargeLanguageModel)在生成獨(dú)立代碼片段時(shí)表現(xiàn)優(yōu)異,但在處理真實(shí)項(xiàng)目中的代碼生成任務(wù)時(shí)面臨三大挑戰(zhàn)。?首先,代碼庫(kù)依賴關(guān)系復(fù)雜,包括跨文件調(diào)用、繼承關(guān)系等結(jié)構(gòu)化關(guān)聯(lián)。例如,在金融領(lǐng)域項(xiàng)目中,一個(gè)交易處理函數(shù)可能需要調(diào)用分布在56個(gè)不同文件中的驗(yàn)證、計(jì)算和日志記錄模塊。?其次,專業(yè)領(lǐng)域知識(shí)缺失問(wèn)題突出,實(shí)驗(yàn)數(shù)據(jù)顯示LLM在生成涉及...
2025-08-04 01:08:40 3971瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1.RAG與大模型推理大型語(yǔ)言模型正在重塑多個(gè)領(lǐng)域,展現(xiàn)出非凡能力,但其應(yīng)用的發(fā)展仍受制于兩大瓶頸:第一,知識(shí)以靜態(tài)參數(shù)的形式存儲(chǔ)導(dǎo)致頻繁出現(xiàn)幻覺(jué)第二,應(yīng)對(duì)復(fù)雜現(xiàn)實(shí)問(wèn)題時(shí)的缺乏推理能力這兩大瓶頸互為因果,知識(shí)缺失會(huì)阻礙推理,而推理缺陷又會(huì)浪費(fèi)已有知識(shí)。為了突破這兩大瓶頸,出現(xiàn)了兩大技術(shù)路線:一是通過(guò)檢索增強(qiáng)生成(RAG)引入外部知識(shí)二是提升模型內(nèi)在推理能力隨著大模型應(yīng)用的深入,大家逐漸開(kāi)始探索檢索與推...
2025-08-04 01:01:39 2818瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1.DataAgent研究現(xiàn)狀1.1AI4Data研究現(xiàn)狀過(guò)去十年,在AI賦能數(shù)據(jù)(AI4Data)領(lǐng)域,運(yùn)用AI技術(shù)攻克了諸多難題:從離線NP難題(如索引優(yōu)化、視圖推薦)到在線挑戰(zhàn)(如查詢重寫(xiě))從基數(shù)估計(jì)等回歸問(wèn)題到學(xué)習(xí)型索引等數(shù)據(jù)結(jié)構(gòu)創(chuàng)新。這些成果往往由于過(guò)度依賴專家調(diào)參,難以適應(yīng)數(shù)據(jù)環(huán)境的變化。1.2Data4AI研究現(xiàn)狀對(duì)于Data4AI領(lǐng)域,將數(shù)據(jù)庫(kù)優(yōu)化技術(shù)延伸至人工智能部署環(huán)節(jié),包括:數(shù)據(jù)庫(kù)內(nèi)機(jī)器學(xué)習(xí)(ML)訓(xùn)練與推理數(shù)據(jù)預(yù)處理、數(shù)據(jù)...
2025-07-11 07:43:43 2639瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、為什么需要RAG技術(shù)?1.1傳統(tǒng)語(yǔ)言模型的局限性傳統(tǒng)的語(yǔ)言模型,比如GPT3,雖然在生成文本方面表現(xiàn)出色,但它們有一個(gè)顯著的局限性:它們依賴于預(yù)訓(xùn)練的參數(shù),無(wú)法動(dòng)態(tài)訪問(wèn)外部知識(shí)。這意味著這些模型在處理實(shí)時(shí)信息、領(lǐng)域特定知識(shí)或罕見(jiàn)實(shí)體時(shí)表現(xiàn)不佳。舉個(gè)例子,在問(wèn)答任務(wù)中,模型可能會(huì)生成不準(zhǔn)確或過(guò)時(shí)的答案,因?yàn)樗鼰o(wú)法訪問(wèn)最新的數(shù)據(jù)。就像你問(wèn)一個(gè)朋友“今天天氣怎么樣?”,但他只能告訴你去年的天氣情況,顯然這...
2025-06-27 00:36:54 4574瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1.背景從深度神經(jīng)網(wǎng)絡(luò)到能對(duì)話、解難題的大型語(yǔ)言模型,技術(shù)突破層出不窮。雖然像OpenAI的GPT4這樣的模型展現(xiàn)出驚人的語(yǔ)言理解能力,但它們大多仍停留在"問(wèn)答助手"階段。真正的進(jìn)化方向在于開(kāi)發(fā)能自主決策并執(zhí)行的通用AI智能體。2025年由中國(guó)初創(chuàng)公司Monica打造的ManusAI,正是這一領(lǐng)域的佼佼者——全球首個(gè)能像人類助手般"思考"并執(zhí)行任務(wù)的真正自主AI。ManusAI的獨(dú)特之處在于不僅能提供建議,更能獨(dú)立規(guī)劃方案、調(diào)用工具、執(zhí)...
2025-06-13 07:02:10 5234瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1.強(qiáng)化學(xué)習(xí)在Text2SQL領(lǐng)域的現(xiàn)狀Text2SQL技術(shù)是將自然語(yǔ)言轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)庫(kù)查詢,通過(guò)賦能非技術(shù)人員高效操作關(guān)系數(shù)據(jù)庫(kù)。當(dāng)前研究聚焦于基礎(chǔ)模型微調(diào),其中強(qiáng)化學(xué)習(xí)(RL)被證實(shí)能顯著提升模型表現(xiàn)。而獎(jiǎng)勵(lì)模型(RM)的精心設(shè)計(jì)尤為重要,其信號(hào)質(zhì)量直接影響微調(diào)效果。在現(xiàn)有RL方案中,有三種主流獎(jiǎng)勵(lì)方案:執(zhí)行準(zhǔn)確率:仍是核心指標(biāo),通過(guò)查詢正確性提供直觀反饋。BradleyTerry獎(jiǎng)勵(lì)模型:基于大模型的BradleyTerry獎(jiǎng)勵(lì)模型(B...
2025-06-03 06:35:09 3665瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1、RAG研究現(xiàn)狀問(wèn)答系統(tǒng)(QA)讓用戶能用自然語(yǔ)言從海量資料中精準(zhǔn)獲取信息,主要分為兩類:開(kāi)放域QA依托常識(shí)作答封閉域QA則需專業(yè)資料支持隨著DeepSeekR1、Grok3等大語(yǔ)言模型(LLM)的突破,文本流暢度和語(yǔ)義理解顯著提升。但這些模型依賴參數(shù)記憶,遇到專業(yè)術(shù)語(yǔ)或復(fù)雜推理時(shí),仍可能"胡言亂語(yǔ)"或答非所問(wèn)。檢索增強(qiáng)生成(RAG)通過(guò)在作答前抓取相關(guān)片段提升準(zhǔn)確性,知識(shí)圖譜(KG)則用結(jié)構(gòu)化關(guān)系網(wǎng)絡(luò)支持多步推理。但現(xiàn)有方案...
2025-06-03 06:19:38 6096瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1.為什么要提出IKEA隨著可驗(yàn)證獎(jiǎng)勵(lì)系統(tǒng)的大規(guī)模強(qiáng)化學(xué)習(xí)(RL)技術(shù)突破,以DeepseekR1為代表的推理模型性能顯著提升。這類模型能通過(guò)推理激活預(yù)訓(xùn)練知識(shí)來(lái)處理知識(shí)密集型任務(wù),但受限于預(yù)訓(xùn)練語(yǔ)料的局限性和世界知識(shí)的動(dòng)態(tài)性,仍存在幻覺(jué)問(wèn)題。當(dāng)前主流解決方案是賦予模型調(diào)用搜索引擎的能力,將其訓(xùn)練為搜索智能體,使其在強(qiáng)化學(xué)習(xí)中逐步掌握任務(wù)分解與知識(shí)檢索能力。然而該方法存在明顯缺陷:其一,過(guò)度依賴LLM的工具調(diào)用功能...
2025-05-20 06:36:41 1979瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1.為什么要提出ScaleMCP隨著大型語(yǔ)言模型(LLMs)與工具學(xué)習(xí)技術(shù)的突飛猛進(jìn),智能體已能動(dòng)態(tài)對(duì)接各類外部工具與API。1.1MCP協(xié)議的誕生模型上下文協(xié)議(MCP)的誕生,為L(zhǎng)LM與外部工具、數(shù)據(jù)源及提示詞建立了標(biāo)準(zhǔn)化橋梁。MCP是由Anthropic推出的一項(xiàng)開(kāi)放協(xié)議,為大型語(yǔ)言模型(LLM)與外部工具、數(shù)據(jù)及提示的交互提供標(biāo)準(zhǔn)化框架。開(kāi)發(fā)者可借助MCP服務(wù)器開(kāi)放工具與數(shù)據(jù)接口,或開(kāi)發(fā)連接這些服務(wù)的AI應(yīng)用(MCP客戶端),大幅降低AI...
2025-05-20 06:34:19 2853瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
1.為什么要提出PaRT框架大型語(yǔ)言模型(LLMs)的突破性進(jìn)展,正推動(dòng)社交聊天機(jī)器人向更智能、更擬人的方向飛速發(fā)展。然而現(xiàn)有系統(tǒng)大多聚焦于情感化應(yīng)答,卻忽視了主動(dòng)對(duì)話的藝術(shù)——那些僅采用被動(dòng)應(yīng)答策略的傳統(tǒng)機(jī)器人,往往讓用戶陷入單方面推動(dòng)對(duì)話的困境,最終導(dǎo)致互動(dòng)索然無(wú)味。主動(dòng)對(duì)話技術(shù)為此提供了破局之道。這類系統(tǒng)能像人類般主動(dòng)開(kāi)啟話題(如"您最向往哪個(gè)旅游勝地?"),或在察覺(jué)用戶興趣減退時(shí)巧妙轉(zhuǎn)場(chǎng)。但當(dāng)前直...
2025-05-07 00:40:04 4490瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
項(xiàng)目倉(cāng)庫(kù):https:github.comallenli1231treehopragArxiv:https:arxiv.orgabs2504.20114在人工智能領(lǐng)域,多跳問(wèn)答(MultihopQuestionAnswering,MHQA)一直是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。這類任務(wù)要求系統(tǒng)通過(guò)多步推理,從不同文檔片段中綜合信息才能得出答案。例如,回答“特朗普的祖父是誰(shuí)?”這樣的問(wèn)題,往往需要先檢索“特朗普的父親是弗雷德·特朗普”,再進(jìn)一步查詢“弗雷德·特朗普的父親是誰(shuí)”。然而,現(xiàn)有方法依賴大型語(yǔ)言模...
2025-05-07 00:36:01 2574瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
為什么需要GUI視覺(jué)定位技術(shù)?1.1數(shù)字時(shí)代的效率革命圖形用戶界面(GraphicalUserInterface,GUI)智能體正在重塑人機(jī)交互方式。這類智能體通過(guò)模仿人類的視覺(jué)感知能力,可以直接"看懂"屏幕內(nèi)容并執(zhí)行操作指令。微軟亞洲研究院團(tuán)隊(duì)的研究表明,相比依賴HTML等GUI元數(shù)據(jù)的傳統(tǒng)方法(存在平臺(tái)依賴性和實(shí)現(xiàn)差異問(wèn)題),基于視覺(jué)的方法具有更廣泛的適用性。例如,在跨平臺(tái)操作場(chǎng)景中,視覺(jué)智能體可以統(tǒng)一處理Windows、Web和移動(dòng)端界面,...
2025-04-22 07:09:35 2971瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、為什么需要混合檢索技術(shù)?1.1大語(yǔ)言模型的"幻覺(jué)"困境大語(yǔ)言模型(LLM,LargeLanguageModel)雖然在文本生成和理解方面表現(xiàn)出色,但存在一個(gè)致命缺陷——會(huì)產(chǎn)生"幻覺(jué)"(Hallucination),即生成看似合理但實(shí)際錯(cuò)誤或無(wú)依據(jù)的內(nèi)容。1.2檢索增強(qiáng)生成的技術(shù)革新檢索增強(qiáng)生成(RAG,RetrievalAugmentedGeneration)技術(shù)應(yīng)運(yùn)而生,它通過(guò)結(jié)合外部知識(shí)庫(kù)為L(zhǎng)LM提供事實(shí)依據(jù)。傳統(tǒng)RAG系統(tǒng)主要采用兩種檢索方式:稀疏檢索(如BM25算法)...
2025-04-22 07:05:07 5282瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
該框架不僅能夠有效挖掘潛在的跨文檔關(guān)系,還能同時(shí)去除無(wú)關(guān)信息和冗余內(nèi)容。我基于GPT3.5構(gòu)建的方法在多個(gè)常用的知識(shí)問(wèn)答和幻覺(jué)檢測(cè)數(shù)據(jù)集上進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,該方法在各種場(chǎng)景和實(shí)驗(yàn)設(shè)置下均實(shí)現(xiàn)了性能的顯著提升,展現(xiàn)出強(qiáng)大的魯棒性和廣泛的適用性。https:arxiv.orgabs2504.03165一、為什么需要高效動(dòng)態(tài)聚類文檔壓縮技術(shù)?1.1大語(yǔ)言模型的挑戰(zhàn)與檢索增強(qiáng)生成(RAG)的興起近年來(lái),大語(yǔ)言模型(LargeLanguageModels...
2025-04-09 06:58:34 3484瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
MESRAG框架,專為提升實(shí)體查詢處理能力而設(shè)計(jì),確保響應(yīng)的準(zhǔn)確、安全與一致。MESRAG采用主動(dòng)安全措施,通過(guò)預(yù)先保護(hù)機(jī)制確保數(shù)據(jù)訪問(wèn)安全。此外,該系統(tǒng)支持實(shí)時(shí)多模態(tài)輸出,包括文本、圖像、音頻和視頻,無(wú)縫融入現(xiàn)有RAG架構(gòu)。一、為什么需要MESRAG技術(shù)?1.1傳統(tǒng)RAG系統(tǒng)的局限性傳統(tǒng)的檢索增強(qiáng)生成(RetrievalAugmentedGeneration,RAG)系統(tǒng)雖然在提升大語(yǔ)言模型(LargeLanguageModels,LLMs)的能力方面表現(xiàn)出色,但它們往往只...
2025-03-27 07:28:13 2468瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
構(gòu)建了一個(gè)涵蓋所有基于圖的RAG方法的統(tǒng)一框架,并從宏觀角度進(jìn)行了總結(jié)。接著,在不同類型的問(wèn)答(QA)數(shù)據(jù)集上對(duì)具有代表性的基于圖的RAG方法進(jìn)行了全面比較,從具體問(wèn)題到抽象問(wèn)題,深入分析了各種方法的表現(xiàn)。通過(guò)實(shí)驗(yàn)分析,不僅揭示了基于圖的RAG方法的有效性,還通過(guò)結(jié)合現(xiàn)有技術(shù),在具體問(wèn)答和抽象問(wèn)答任務(wù)中發(fā)現(xiàn)了優(yōu)于現(xiàn)有最優(yōu)方法的新變體。??https:arxiv.orgpdf2503.04338??一、為什么需要圖檢索增強(qiáng)生成(Graphb...
2025-03-27 07:24:37 5440瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
ViDoRAG:VisualDocumentRetrievalAugmentedGenerationviaDynamicIterativeReasoningAgentsViDoRAG——一個(gè)專為視覺(jué)文檔復(fù)雜推理設(shè)計(jì)的多智能體RAG框架。ViDoRAG采用基于高斯混合模型(GMM)的混合策略,實(shí)現(xiàn)高效多模態(tài)檢索。為進(jìn)一步挖掘模型推理潛力,我們?cè)O(shè)計(jì)了一個(gè)包含探索、總結(jié)與反思的迭代智能體工作流,為研究RAG領(lǐng)域的測(cè)試時(shí)擴(kuò)展提供了全新框架,超越現(xiàn)有方法10%以上。https:arxiv.orgabs2502.18017一、為什么需要ViDoR...
2025-03-17 00:58:32 4122瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、為什么需要RAG和GraphRAG技術(shù)?1.1大模型的局限性大型語(yǔ)言模型(LLMs,LargeLanguageModels)雖然在生成文本方面表現(xiàn)出色,但它們存在一些固有缺陷。比如,LLMs容易出現(xiàn)“幻覺(jué)”現(xiàn)象,即生成不準(zhǔn)確或虛構(gòu)的內(nèi)容。此外,LLMs的上下文窗口有限,無(wú)法處理過(guò)長(zhǎng)的文本,還存在隱私泄露的風(fēng)險(xiǎn)。為了彌補(bǔ)這些不足,檢索增強(qiáng)生成(RAG,RetrievalAugmentedGeneration)技術(shù)應(yīng)運(yùn)而生。RAG通過(guò)從外部數(shù)據(jù)源檢索相關(guān)信息,顯著提升了模型...
2025-03-05 10:34:45 3636瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、RAG系統(tǒng)的背景與挑戰(zhàn)在自然語(yǔ)言處理(NLP)領(lǐng)域,大型語(yǔ)言模型(LLMs)如GPT、BERT等已經(jīng)展現(xiàn)出了強(qiáng)大的文本生成、問(wèn)答和摘要能力。然而,這些模型也存在一些顯著的局限性。?首先,LLMs的知識(shí)是靜態(tài)的,這意味著它們無(wú)法及時(shí)更新以反映新信息,導(dǎo)致生成的回答可能過(guò)時(shí)。?其次,LLMs有時(shí)會(huì)生成聽(tīng)起來(lái)合理但事實(shí)上錯(cuò)誤的回答,這種現(xiàn)象被稱為“幻覺(jué)”。?最后,LLMs在涉及高級(jí)專業(yè)領(lǐng)域的知識(shí)時(shí),往往缺乏足夠的深度。為了應(yīng)...
2025-02-24 11:28:00 3460瀏覽 0點(diǎn)贊 0回復(fù) 0收藏