跳转到主要内容

标签(标签)

资源精选(342) Go开发(108) Go语言(103) Go(99) angular(83) LLM(79) 大语言模型(63) 人工智能(54) 前端开发(50) LangChain(43) golang(43) 机器学习(39) Go工程师(38) Go程序员(38) Go开发者(36) React(34) Go基础(29) Python(24) Vue(23) Web开发(20) Web技术(19) 精选资源(19) 深度学习(19) Java(18) ChatGTP(17) Cookie(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) 安卓(11) 聊天机器人(10) typescript(10) 资料精选(10) NLP(10) 第三方Cookie(9) Redwoodjs(9) ChatGPT(9) LLMOps(9) Go语言中级开发(9) 自然语言处理(9) PostgreSQL(9) 区块链(9) mlops(9) 安全(9) 全栈开发(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 软件架构(7) RAG(7) Go语言高级开发(7) AWS(7) C++(7) 数据科学(7) 智能体(6) whisper(6) Prisma(6) 隐私保护(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 提示工程(5) Agent(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) kafka(5) 推荐系统(5) WebAssembly(5) GameDev(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) nextjs(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) RAG架构(4) devin(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) 移动开发(4) 移动应用(4) security(4) 隐私(4) spring-boot(4) 物联网(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) LLM Agent(3) Remix(3) Ubuntu(3) GPT4All(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) gpt3(3) 工作流(3) C(3) jupyter(3) 认证(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) 语言模型(2) 可穿戴设备(2) JDK(2) SQL(2) Apache(2) Hashicorp Vault(2) Spring Cloud Vault(2) Go语言Web开发(2) Go测试工程师(2) WebSocket(2) 容器化(2) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) 数据分析(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) 知识图谱(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) Machine Learning(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

【LLM架构】用于评估LLM生成内容的指标列表

评估方法衡量我们的系统性能如何。对每个摘要进行人工评估(人工审查)既费时又昂贵,而且不可扩展,因此通常会辅以自动评估。许多自动评估方法试图衡量人类评估者会考虑的文本质量。这些品质包括流畅性、连贯性、相关性、事实一致性和公平性。内容或风格与参考文本的相似性也可能是生成文本的重要质量。

下图包括用于评估LLM生成内容的许多指标,以及如何对其进行分类。

【职业发展】CAIS:认证人工智能科学家考试准备

通过我们的综合实践测试掌握CAIS


通过USAII认证的人工智能科学家(CAIS)实践测试为成功做好准备!

你的目标是成为一名认证的人工智能科学家(CAIS)吗?我们详细而富有挑战性的实践测试旨在帮助您脱颖而出。我们的测试侧重于人工智能伦理、偏见、可解释性、隐私和对抗性攻击等核心领域,将确保您为CAIS考试做好充分准备。


为什么选择我们的CAIS实践测试?

对关键主题的全面报道


我们的实践测试涵盖了基本主题,包括偏见、可解释性、隐私问题和对抗性攻击。通过熟悉这些领域,你将能够自信而准确地应对复杂的问题。

与CAIS考试目标一致


每个问题都经过精心设计,与认证人工智能科学家考试的目标保持一致。这确保您正在学习反映您在考试中遇到的内容的相关材料。

真实的考试体验


我们的问题旨在模仿实际CAIS考试的格式和难度。通过练习这些问题,您将获得宝贵的经验并减少考试焦虑。

详细说明


每个问题都有一个彻底的解释,帮助你理解正确答案背后的推理。这不仅有助于掌握复杂的概念,而且有助于有效地应用它们。
 

【AI模型】LLM中检查点上的检查点

如果你一直在关注深度学习的最新消息,你就会意识到深度学习中的数据和模型非常庞大。数据集的大小可能达到PB级,模型本身的大小也可能达到数百GB。这意味着,即使是模型本身也无法放入标准GPU芯片的内存中。高效和智能的并行化以及可恢复性在深度学习领域至关重要。

最近的一些文献主要关注LLM系统的基础设施配置。如果你了解VAST,你就会知道这正是我们的专长,因为我们不仅喜欢谈论数据基础设施,还喜欢谈论所有可以推动技术从数据中获得最大价值的神奇方法。因此,事不宜迟,我们想向您介绍并行性如何影响当今最复杂模型中的检查点和恢复操作。

在所有维度上并行化


对于LLM和其他大规模深度学习算法中固有的大型数据集和大型模型,数据和模型本身都太大,无法放入内存。例如,具有数十亿个参数的典型LLM将不适合内存。GPT-3的大小大于500 GB,典型的GPU限制为80 GB的VMEM。此外,单个A100 GPU需要几百年的时间来训练GPT-3(实际上需要300多年)。因此,多维并行性对于训练和微调模型至关重要。

这一论点基于该领域的广泛研究,特别是斯坦福大学、英伟达和微软研究院的开创性论文《威震天LM大规模训练》。作者提出,并在现场得到证实,三种并行性的综合允许LLM中更易于管理和恢复的工作负载:

【LLM架构】Dify与Ragflow的比较

Dify与Ragflow:LLM应用程序开发的关键差异


使用大型语言模型(LLM)的应用程序开发随着Dify和Ragflow等平台的发展而显著发展。了解这两者之间的关键区别可以帮助开发人员根据自己的需求选择合适的工具。

数据准备


Dify通过提供数据收集和预处理的集成工具,在数据准备方面表现出色。这最大限度地减少了对大量编码的需求,使开发人员能够专注于更高级别的任务。相比之下,Ragflow可能需要在数据清理和注释方面进行更多的手动干预,这可能会减缓开发过程。

提示工程


Dify提供了一个所见即所得(WYSIWYG)界面,用于快速编辑和调试。此功能允许基于用户输入进行实时优化,使在没有深厚技术知识的情况下更容易细化提示。Ragflow虽然功能强大,但可能无法提供相同水平的用户友好的快速工程工具,这可能会导致新用户的学习曲线更陡峭。

嵌入和上下文管理


借助Dify,嵌入和上下文管理实现了自动化,从而增强了可扩展性和效率。开发人员不需要编写大量代码来管理长上下文,因为Dify可以无缝地处理这个问题。另一方面,Ragflow可能需要更多的手动编码来实现类似的结果,这可能会增加开发时间和复杂性。

【前端开发】JavaScript框架的进步:2025年React、NextJS、Angular、Vue.js和Svelte的新进展

太长;未阅读:


2025年,React、Next.js、Angular、Vue.js和Svelte等主要JavaScript框架引入了增强web开发的尖端功能。React在并发模式下的加载速度提高了40%,而Next.js则彻底改变了服务器端渲染和代码优化。Angular专注于增量水合的开发人员体验,Vue.js拥有改进的开发人员工具和组件API标准化,Svelte为快速加载提供零运行时间编译。这些框架强调性能、TypeScript集成和服务器端渲染,塑造了web应用程序的未来。

JavaScript框架将在2025年彻底改变游戏规则,我很高兴能分析一下正在发生的事情。服务器优先方法的最新发展改变了我们构建web应用程序的方式。

React、Next.js、Angular、Vue.js和Svelte不再只是工具,它们正在塑造web开发的未来。

【大型语言模型】建立有效的智能体

在过去的一年里,我们与数十个团队合作,在各个行业构建了大型语言模型(LLM)智能体。一直以来,最成功的实现并没有使用复杂的框架或专门的库。相反,他们用简单、可组合的模式进行构建。

在这篇文章中,我们分享了我们从与客户和构建智能体合作中学到的东西,并为开发人员提供了构建有效智能体的实用建议。

什么是智能体?


“Agent”可以通过多种方式定义。一些客户将智能体定义为在长时间内独立运行的完全自主的系统,使用各种工具来完成复杂的任务。其他人则使用该术语来描述遵循预定义工作流的更规范的实现。在Anthropic,我们将所有这些变体归类为智能体系统,但在工作流和智能体之间进行了重要的架构区分:

  • 工作流是通过预定义的代码路径编排LLM和工具的系统。
  • 另一方面,智能体是LLM动态指导自己的流程和工具使用的系统,保持对它们如何完成任务的控制。

下面,我们将详细探讨这两种类型的智能体系统。在附录1(“实践中的智能体”)中,我们描述了客户发现使用这些系统具有特殊价值的两个领域。

【ChatGPT】ChatGPT与置信度评分

在这篇文章中,我们将着眼于使用通过OpenAI API可用的置信度分数。

在第一部分中,我们将从对这些分数的温和探索开始,并在自定义聊天界面的帮助下了解它们的含义。

在第二节中,我们将探讨在代码中使用置信度得分。

探索“信心”


首先,快速入门LLM在其响应中为每个令牌做了什么:

  • 该模型为其词汇表中的每个标记输出一个值(~100000个值)
  • 然后,这些值被转化为我们(怀疑地)称之为“概率”的值。这些价值观是本文的重点。
  • 然后以概率方式选择单个令牌(有时是具有最高值的令牌,有时不是)并在响应中使用


现在,让我们对一些术语进行排序:我们在这篇文章中使用的值并不是真正的“概率”(在“某事发生的可能性有多大”的意义上),也不是任何有意义的“信心”。它们只是LLM输出的数字,经过调整使其为正并加1(对于数学家来说,这足以获得任何一组数字的标签“概率分布”)。

因此,你可以将“概率”添加到术语列表中,这些术语在学术界意味着一件事,但在现实世界中却略有不同,导致广泛的误解(以及“理论”、“意义”等)。

【RAG架构】RAG的四个层次——微软的研究

改进检索增强生成(RAG)涉及基于用户意图和关注上下文对查询进行分类。还利用SLM和微调来提供更准确和相关的结果。

简而言之


选择正确的RAG(检索增强生成)架构主要取决于具体的用例和实现要求,确保系统与任务需求保持一致。

Agent RAG的重要性将越来越高,与Agent X的概念相一致,其中Agent能力嵌入个人助理、工作流程和流程中。

在这里,“X”代表了代理系统的无限适应性,实现了无缝的任务自动化和跨不同环境的知情决策,以提高组织效率和自主性。

综合不同的文档源对于有效解决复杂的多部分查询至关重要。

介绍


提供准确的RAG实施的挑战包括检索相关数据、准确解释用户意图,以及利用LLM的推理能力完成复杂任务。

推理可以通过像ReAct这样的RAG代理方法来增强,在这种方法中,可以创建事件的推理和行为序列。

我从这项研究中发现了一个有趣的事实,即它指出没有一种单一的解决方案适用于所有数据增强的LLM应用程序。

上下文是指围绕对话的信息,帮助人工智能理解用户的意图并提供相关、连贯的回应。

这包括用户之前的输入、当前任务、环境以及可能影响对话的任何外部数据等因素。

【RAG架构】RAG的最佳实践

RAG的过程很复杂,包含许多组件。我们如何确定现有的RAG方法及其最佳组合,以确定最佳的RAG实践?

本文介绍了一项名为“搜索增强生成检索的最佳实践”的新研究。本研究旨在解决这个问题。

本文主要分为四个部分。首先,介绍了典型的RAG工艺。接下来,它介绍了每个RAG模块的最佳实践。然后,它提供了一个全面的评估。最后,它分享了我的想法和见解,并以总结结束。

典型RAG工作流程