docs:add docsify deploy
This commit is contained in:
@@ -47,7 +47,7 @@
|
||||
Open LLM Leaderboard 为由 Hugging Face 提供的开放式榜单,汇集了多个开源大模型的评测结果,帮助用户了解不同模型在各种任务上的表现。该榜单通过多个标准化测试集来评估模型的性能,并通过持续更新的方式反映最新的技术进展,为研究者和开发者提供了高价值的对比参考,如图7.1所示。
|
||||
|
||||
<div align='center'>
|
||||
<img src="./images/7-1-Open%20LLM%20Leaderboard.png" alt="alt text" width="90%">
|
||||
<img src="../images/7-images/7-1-Open%20LLM%20Leaderboard.png" alt="alt text" width="90%">
|
||||
<p>图 7.1 Open LLM Leaderboard</p>
|
||||
</div>
|
||||
|
||||
@@ -56,7 +56,7 @@ Open LLM Leaderboard 为由 Hugging Face 提供的开放式榜单,汇集了多
|
||||
由lmsys提供的聊天机器人评测榜单,通过多维度的评估,展示各类大模型在对话任务中的能力。该榜单采用真实用户与模型交互的方式来评测对话质量,重点考察模型的自然语言生成能力、上下文理解能力以及用户满意度,是当前评估聊天机器人性能的重要工具,如图7.2所示。
|
||||
|
||||
<div align='center'>
|
||||
<img src="./images/7-1-lmsys%20Chatbot%20Arena%20Leaderboard.png" alt="alt text" width="90%">
|
||||
<img src="../images/7-images/7-1-lmsys%20Chatbot%20Arena%20Leaderboard.png" alt="alt text" width="90%">
|
||||
<p>图7.2 Lmsys Chatbot Arena Leaderboard</p>
|
||||
</div>
|
||||
|
||||
@@ -65,7 +65,7 @@ Open LLM Leaderboard 为由 Hugging Face 提供的开放式榜单,汇集了多
|
||||
OpenCompass 是国内的评测榜单,针对大模型在多种语言和任务上的表现进行评估,提供了中国市场特定应用的参考。该榜单结合了中文语言理解和多语言能力的测试,以适应本地化需求,并特别关注大模型在中文语境下的准确性、鲁棒性和适应性,为国内企业和研究者选择合适的模型提供了重要参考。
|
||||
|
||||
<div align='center'>
|
||||
<img src="./images/7-1-opencompass.png" alt="alt text" width="90%">
|
||||
<img src="../images/7-images/7-1-opencompass.png" alt="alt text" width="90%">
|
||||
<p>图7.3 OpenCompass</p>
|
||||
</div>
|
||||
|
||||
@@ -84,7 +84,7 @@ OpenCompass 是国内的评测榜单,针对大模型在多种语言和任务
|
||||
- 医疗榜:基于MedBench评测集,评估大语言模型在医学知识问答、安全伦理理解等方面的表现。由上海人工智能实验室提供。
|
||||
|
||||
<div align='center'>
|
||||
<img src="./images/7-1-垂直领域榜单.png" alt="alt text" width="90%">
|
||||
<img src="../images/7-images/7-1-垂直领域榜单.png" alt="alt text" width="90%">
|
||||
<p>图7.4 垂直领域榜单</p>
|
||||
</div>
|
||||
|
||||
@@ -118,7 +118,7 @@ RAG的基本结构有哪些呢?
|
||||
上述也就是 TinyRAG 的所有模块内容,如图7.5所示。
|
||||
|
||||
<div align='center'>
|
||||
<img src="./images/7-2-tinyrag.png" alt="alt text" width="90%">
|
||||
<img src="../images/7-images/7-2-tinyrag.png" alt="alt text" width="90%">
|
||||
<p>图7.5 TinyRAG 项目结构</p>
|
||||
</div>
|
||||
|
||||
@@ -131,7 +131,7 @@ RAG的基本结构有哪些呢?
|
||||
如下图7.6所示的流程图,图片出处 ***[Retrieval-Augmented Generation for Large Language Models: A Survey](https://arxiv.org/pdf/2312.10997.pdf)***
|
||||
|
||||
<div align='center'>
|
||||
<img src="./images/7-2-rag.png" alt="alt text" width="90%">
|
||||
<img src="../images/7-images/7-2-rag.png" alt="alt text" width="90%">
|
||||
<p>图7.6 RAG 流程图</p>
|
||||
</div>
|
||||
|
||||
@@ -403,7 +403,7 @@ print(chat.chat(question, [], content))
|
||||
传统的LLM像一个知识渊博但只能纸上谈兵的图书馆员,而 LLM Agent 则更像一个全能的私人助理,不仅懂得多,还能跑腿办事,甚至能主动思考最优方案。
|
||||
|
||||
<div align='center'>
|
||||
<img src="./images/7-3-Agent工作原理.png" alt="alt text" width="90%">
|
||||
<img src="../images/7-images/7-3-Agent工作原理.png" alt="alt text" width="90%">
|
||||
<p>图7.7 Agent 工作原理</p>
|
||||
</div>
|
||||
|
||||
@@ -440,7 +440,7 @@ LLM Agent 通过将大型语言模型的强大语言理解和生成能力与规
|
||||
最终的实现效果如图7.8所示:
|
||||
|
||||
<div align='center'>
|
||||
<img src="./images/7-3-tinyagent-example.png" style="width: 100%;">
|
||||
<img src="../images/7-images/7-3-tinyagent-example.png" style="width: 100%;">
|
||||
<p>图7.8 效果示意图</p>
|
||||
</div>
|
||||
|
||||
@@ -633,7 +633,7 @@ Agent 的工作流程如下:
|
||||
如图7.9所示,Agent 调用工具流程:
|
||||
|
||||
<div align='center'>
|
||||
<img src="./images/7-3-Tiny_Agent.jpg" alt="alt text" width="80%">
|
||||
<img src="../images/7-images/7-3-Tiny_Agent.jpg" alt="alt text" width="80%">
|
||||
<p>图7.9 Agent 工作流程</p>
|
||||
</div>
|
||||
|
||||
|
||||
Reference in New Issue
Block a user