跳转到主要内容

标签(标签)

资源精选(342) Go开发(108) Go语言(103) Go(99) LLM(84) angular(83) 大语言模型(67) 人工智能(56) 前端开发(50) LangChain(43) golang(43) 机器学习(39) Go工程师(38) Go程序员(38) Go开发者(36) React(34) Go基础(29) Python(24) Vue(23) Web开发(20) 深度学习(20) Web技术(19) 精选资源(19) Java(19) ChatGTP(17) Cookie(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) LLMOps(11) 聊天机器人(11) 安卓(11) ChatGPT(10) typescript(10) 资料精选(10) mlops(10) NLP(10) 第三方Cookie(9) Redwoodjs(9) RAG(9) Go语言中级开发(9) 自然语言处理(9) PostgreSQL(9) 区块链(9) 安全(9) 全栈开发(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 智能体(7) 软件架构(7) Go语言高级开发(7) AWS(7) C++(7) 数据科学(7) whisper(6) Prisma(6) 隐私保护(6) 提示工程(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 生成式AI(5) Agent(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) kafka(5) 推荐系统(5) WebAssembly(5) GameDev(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) nextjs(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) RAG架构(4) devin(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) 移动开发(4) 移动应用(4) security(4) 隐私(4) spring-boot(4) 物联网(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) LLM Agent(3) Remix(3) Ubuntu(3) GPT4All(3) 模型评估(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) 数据分析(3) gpt3(3) 工作流(3) C(3) jupyter(3) 认证(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) JDK(2) SQL(2) Apache(2) Hashicorp Vault(2) Spring Cloud Vault(2) Go语言Web开发(2) Go测试工程师(2) WebSocket(2) 容器化(2) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) 知识图谱(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) Machine Learning(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

【DeepSeek】15个DeepSeek和Chatgpt提示,帮你向任何人销售任何东西

提示 #1:SPIN销售的解决方案销售方法
"利用SPIN销售技巧(情境、问题、影响、需求回报)来识别客户痛点并提供量身定制的解决方案。通过提问揭示客户需求,提出解决方案来解决特定问题,并强调解决方案的好处和价值主张。输入:列出客户可能提出的常见反对意见或障碍。给出这个答案后,请询问我提供的定制输入,然后基于这些输入运行提示。"

【观点】Anthropic的研究提供了一个清新且理性的关于AI的视角

Anthropic的研究提供了一个清新且理性的视角……

Anthropic的研究强调以实际应用和用例为导向的解决方案,尽可能简单,同时注重可解释性、可观察性和可检查性。

它警告不要在不了解其内部工作原理的情况下采用某些框架,因为这可能导致意想不到的行为。

尽管AI代理有其用处,但它们并非总是最佳解决方案——工作流往往更加合适。

有些公司可能推销特定的框架来销售其技术堆栈,而忽视最佳实践,或者在实现业务目标时妥协,未选择最优化和最合适的路径。


他们的主要观察是,最成功的实施往往避免使用复杂的框架或专业库,而是倾向于选择简单、可组合的模式。

在使用大型语言模型(LLM)时,他们建议从最简单的解决方案开始,只有在必要时才增加复杂度。

有时候,这意味着根本不构建代理系统,因为这些系统通常通过牺牲延迟和成本来换取更好的任务执行效果,而这一权衡应该仔细考虑。

【LLM框架】MemGPT 介绍

MemGPT 是一个基于记忆增强的 GPT(生成预训练变换器)模型,旨在通过集成外部记忆系统来提升语言模型在长期对话和复杂任务中的表现。它通过引入持久性记忆来扩展模型的上下文感知能力,解决了传统语言模型在处理长篇对话和多轮任务时常遇到的“短期记忆”问题。

【LLM框架】RAGFlow 介绍

RAGFlow 是一个开源的 RAG(Retrieval-Augmented Generation)引擎,旨在通过深度文档理解(Deep Document Understanding)技术增强生成式模型的性能,尤其是在基于大规模文本数据进行信息检索和生成内容时。它将文档检索与生成能力相结合,提高了生成模型在处理复杂问题时的准确性和上下文相关性。

【LLM评估】LLM 评估指标:终极 LLM 评估指南

尽管对于任何希望交付强大的 LLM 应用程序的人来说,评估大型语言模型 (LLM) 的输出都是必不可少的,但 LLM 评估对许多人来说仍然是一项艰巨的任务。无论您是通过微调来提高模型的准确性,还是增强检索增强生成 (RAG) 系统的上下文相关性,了解如何为您的用例开发和决定适当的 LLM 评估指标集对于构建坚不可摧的 LLM 评估管道都是必不可少的。

本文将教您有关 LLM 评估指标的所有知识,并附上代码示例。我们将深入探讨:

  • 什么是 LLM 评估指标,如何使用它们来评估 LLM 系统,常见的陷阱,以及是什么让优秀的 LLM 评估指标变得优秀。
  • 对 LLM 评估指标进行评分的所有不同方法,以及为什么 LLM-as-a-judge 最适合 LLM 评估。
  • 如何使用 DeepEval (⭐https://github.com/confident-ai/deepeval) 实现并决定在代码中使用的适当的 LLM 评估指标集。
    您准备好阅读这份长长的清单了吗?让我们开始吧。

(更新:如果您正在寻找评估 LLM 聊天机器人/对话的指标,请查看这篇新文章!)

【AI模型】LLM中检查点上的检查点

如果你一直在关注深度学习的最新消息,你就会意识到深度学习中的数据和模型非常庞大。数据集的大小可能达到PB级,模型本身的大小也可能达到数百GB。这意味着,即使是模型本身也无法放入标准GPU芯片的内存中。高效和智能的并行化以及可恢复性在深度学习领域至关重要。

最近的一些文献主要关注LLM系统的基础设施配置。如果你了解VAST,你就会知道这正是我们的专长,因为我们不仅喜欢谈论数据基础设施,还喜欢谈论所有可以推动技术从数据中获得最大价值的神奇方法。因此,事不宜迟,我们想向您介绍并行性如何影响当今最复杂模型中的检查点和恢复操作。

在所有维度上并行化


对于LLM和其他大规模深度学习算法中固有的大型数据集和大型模型,数据和模型本身都太大,无法放入内存。例如,具有数十亿个参数的典型LLM将不适合内存。GPT-3的大小大于500 GB,典型的GPU限制为80 GB的VMEM。此外,单个A100 GPU需要几百年的时间来训练GPT-3(实际上需要300多年)。因此,多维并行性对于训练和微调模型至关重要。

这一论点基于该领域的广泛研究,特别是斯坦福大学、英伟达和微软研究院的开创性论文《威震天LM大规模训练》。作者提出,并在现场得到证实,三种并行性的综合允许LLM中更易于管理和恢复的工作负载:

【RAG架构】RAG的四个层次——微软的研究

改进检索增强生成(RAG)涉及基于用户意图和关注上下文对查询进行分类。还利用SLM和微调来提供更准确和相关的结果。

简而言之


选择正确的RAG(检索增强生成)架构主要取决于具体的用例和实现要求,确保系统与任务需求保持一致。

Agent RAG的重要性将越来越高,与Agent X的概念相一致,其中Agent能力嵌入个人助理、工作流程和流程中。

在这里,“X”代表了代理系统的无限适应性,实现了无缝的任务自动化和跨不同环境的知情决策,以提高组织效率和自主性。

综合不同的文档源对于有效解决复杂的多部分查询至关重要。

介绍


提供准确的RAG实施的挑战包括检索相关数据、准确解释用户意图,以及利用LLM的推理能力完成复杂任务。

推理可以通过像ReAct这样的RAG代理方法来增强,在这种方法中,可以创建事件的推理和行为序列。

我从这项研究中发现了一个有趣的事实,即它指出没有一种单一的解决方案适用于所有数据增强的LLM应用程序。

上下文是指围绕对话的信息,帮助人工智能理解用户的意图并提供相关、连贯的回应。

这包括用户之前的输入、当前任务、环境以及可能影响对话的任何外部数据等因素。

【RAG架构】RAG的最佳实践

RAG的过程很复杂,包含许多组件。我们如何确定现有的RAG方法及其最佳组合,以确定最佳的RAG实践?

本文介绍了一项名为“搜索增强生成检索的最佳实践”的新研究。本研究旨在解决这个问题。

本文主要分为四个部分。首先,介绍了典型的RAG工艺。接下来,它介绍了每个RAG模块的最佳实践。然后,它提供了一个全面的评估。最后,它分享了我的想法和见解,并以总结结束。

典型RAG工作流程

【LLM应用架构】Apache Kafka+矢量数据库+LLM=实时GenAI

生成式人工智能(GenAI)实现了先进的人工智能用例和创新,但也改变了企业架构的样子。大型语言模型(LLM)、矢量数据库和检索增强生成(RAG)需要新的数据集成模式和数据工程最佳实践。Apache Kafka和Apache Flink的数据流在大规模实时摄取和管理传入数据集、连接各种数据库和分析平台以及分离独立业务部门和数据产品方面发挥着关键作用。这篇博客文章探讨了事件流和传统请求-响应API和数据库之间可能的架构、示例和权衡。

(最初发布在Kai Waehner的博客上:“Apache Kafka+矢量数据库+LLM=实时GenAI”……