跳转到主要内容

标签(标签)

资源精选(342) Go开发(108) Go语言(103) Go(99) angular(83) LLM(79) 大语言模型(63) 人工智能(53) 前端开发(50) LangChain(43) golang(43) 机器学习(39) Go工程师(38) Go程序员(38) Go开发者(36) React(34) Go基础(29) Python(24) Vue(23) Web开发(20) Web技术(19) 精选资源(19) 深度学习(19) Java(18) ChatGTP(17) Cookie(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) 安卓(11) 聊天机器人(10) typescript(10) 资料精选(10) NLP(10) 第三方Cookie(9) Redwoodjs(9) ChatGPT(9) LLMOps(9) Go语言中级开发(9) 自然语言处理(9) PostgreSQL(9) 区块链(9) mlops(9) 安全(9) 全栈开发(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 软件架构(7) RAG(7) Go语言高级开发(7) AWS(7) C++(7) 数据科学(7) 智能体(6) whisper(6) Prisma(6) 隐私保护(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 提示工程(5) Agent(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) kafka(5) 推荐系统(5) WebAssembly(5) GameDev(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) nextjs(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) RAG架构(4) devin(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) 移动开发(4) 移动应用(4) security(4) 隐私(4) spring-boot(4) 物联网(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) LLM Agent(3) Remix(3) Ubuntu(3) GPT4All(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) gpt3(3) 工作流(3) C(3) jupyter(3) 认证(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) 语言模型(2) 可穿戴设备(2) JDK(2) SQL(2) Apache(2) Hashicorp Vault(2) Spring Cloud Vault(2) Go语言Web开发(2) Go测试工程师(2) WebSocket(2) 容器化(2) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) 数据分析(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) 知识图谱(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) Machine Learning(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

category

什么是MLOps?


机器学习操作(MLOps)可以被视为软件开发操作(DevOps)中的一个子集挑战,后者包括用于简化公司软件交付流程的软件工程最佳实践和原则。


MLOps专注于ML驱动的项目和产品开发带来的独特挑战,特别是由于ML的新生状态、工件管理和再现性问题、独特的基础设施要求、对实验和监控的永久需求以及对数据域不稳定性的控制。


MLOps工程师通常致力于提高团队内部和跨团队的ML模型部署以及价值创造效率和影响力,重点关注在涉及开发人员和运营团队之间的反馈回路时通常会遇到紧张的流程。从本质上讲,MLOps旨在最大限度地减少这些团队之间在项目生命周期中的摩擦,以减少价值实现的时间,并最大限度地提高团队工作的影响。


机器学习工程师的工作流程,从最初的开发到最终的部署和集成到价值链,通常由4个核心任务组成:


图1:ML工程师工作流程。图改编自Shankar等人(2020)


当今解决方案生态系统中的一个悬而未决的问题是此工作流的标准化。不同的问题域、数据模式和行业应用程序可能需要偏离、添加或对这些任务进行不同的强调。


大型语言模型范式转变对MLOps的影响


LLMOps与MLOps位于同一领域,但为类似的任务带来了新的维度。在某种程度上,LLMOps只是图1中工作流的另一种风格,但由于与任务约定(包括培训、部署和维护)存在重大偏差,LLM需要不同的概念化和讨论。


在从MLOps到LLMOps的过渡过程中,对任务级别差异的分析强调了对传统ML任务进行改编和扩展的必要性。这些调整对于在企业领域内有效运作LLM至关重要。


任务MLOps(来自Shankar等人2020)LLMOps

 

Task MLOps (from Shankar et al. 2020) LLMOps
数据收集和标记 寻源新数据、争论数据、清理数据和数据标签(外包或内部)。 需要更大规模的数据收集,并强调数据的多样性和代表性。可能需要自动化或半自动化的标记技术,例如用于数据注释的预训练模型、主动学习或弱监督方法
特征工程与模型实验 通过数据驱动或模型驱动的实验提高ML性能,例如创建新功能或更改模型架构。 由于LLM能够从原始数据中学习有效的特征表示,在不久的将来转向快速设计和微调,因此特征工程变得不那么重要。模型实验继续发挥着至关重要的作用,但在短期内将回到数据科学发展的早期阶段,围绕着为特定用例获得一致执行的模型,需要快速迭代速度来创造价值。长期来看,由于LLM能力的快速进步和转变,我们在这一领域的发展方向尚不明确。
模型评估和部署 在验证数据集上计算度量(例如准确性)。部署包括暂存、A/B测试和保留回滚记录。 评估和部署更加微妙,需要一套更广泛的指标和技术来评估公平性、稳健性和可解释性,而不仅仅是准确性。其中可能包括“黄金测试集”,这是对狭窄问题/任务的人工验证反馈。部署需要强大的工具来管理训练数据、训练过程、模型的版本控制,并可能根据用例在不同的模型之间切换。漂移检测系统和处理对抗性攻击或错位输入的措施也是至关重要的。这些任务的复杂性可能需要新的角色或专业技能。
ML管道监测和响应 跟踪实时指标,调查预测质量,用非ML启发式方法修补模型,并将失败添加到评估集中。 涉及使用“观察者模型”等工具在多个任务、语言和域中跟踪模型性能,“观察者模式”是自动评估输出以进行实时监控的其他LLM或ML模型。监控潜在的偏见、道德问题或意外后果。对问题的响应可能包括调整提示、根据新的示例或边缘案例微调模型,甚至重新训练模型

This table will change significantly in the near future as our knowledge and capabilities in LLMOps become more refined.

标签