您现在的位置是:首页 > 编程 > 

Agent、AIGC、具身智能大模型方向的商业案例集锦

2025-07-28 20:02:53
算是一份摘录 文章目录 1 AIGC1.1 AIGC 对影楼的影响1.2 养眼的天工AI图片生成1. AIGC的数码印花按需定制供应链重构策略研究1.4 Soul 基于 AIGC 的实践与探索1.5 Style DA - AI 穿搭造型师1.6 极睿科技:电商内容营销 AI1.7 快手

算是一份摘录

文章目录

  • 1 AIGC
    • 1.1 AIGC 对影楼的影响
    • 1.2 养眼的天工AI图片生成
    • 1. AIGC的数码印花按需定制供应链重构策略研究
    • 1.4 Soul 基于 AIGC 的实践与探索
    • 1.5 Style DA - AI 穿搭造型师
    • 1.6 极睿科技:电商内容营销 AI
    • 1.7 快手 Kolors 可图大模型应用实践
    • 1.8 AIGC 赋能展示广告:大模型在小红书标题生成中的深度实践
      • 1.8.1 关键词感知生成模型训练
      • 1.8.2 调性:和社区不割裂的广告标题
    • 1.9 AIGC帮跨境商家们省钱的诀窍是什么?
    • 1.10 阿里巴巴AIGC技术:Quick BI产品形态探索
    • 1.11 AIGC技术:如何用人工智能革新营销素材创作?
    • 1.12 火山引擎营销套件帮助AIGC公司获客
      • 1.12.1 获客场景应用
      • 1.12.2 产品优化
    • 1.1 淘宝AI试衣素材高效写入IC实践
    • 1.14 银泰百货:如何用AI造出爆款【深度洞察】
    • 1.15 智慧门店:线下门店如何巧用AIGC,提升转化?
    • 1.16 智能货物定损智能图片
  • 2 Agent / ChatBot / 大模型
    • 2.1 出海Talkie :情感智能体
    • 2.2 易慧智能技术 - 多Agent在汽车行业落地实践
    • 2. 京东物流:利用大模型服务一线小哥的探索与实践
    • 2.4 AI赋能下的:策略、实践与价值创造
    • 2.5 腾讯文档AI助手技术实践
    • 2.6 客服坐席辅助系统的探索与实践
    • 2.7 大模型在新能源领域的应用:工业质检Agent
    • 2.8 大模型在小爱同学应用实践
      • 2.8.1 小爱意图理解方式
      • 2.8.2 大模型回复的问题
      • 2.8. RAG 场景下大模型回复
    • 2.9 货拉拉利用大模型打造多场景个人、办公助理实践
      • 2.9.1 专业助手
      • 2.9.2 AI 问答助手
      • 2.9. 周报生成助手
      • 2.9.4 多模态 AI 助手:车险报价方案生成助手
      • 2.9.5 多模态 AI 助手:AI 培训对练助手
      • 2.9.6 多 Agent 助手
    • 2.10 基于大语言模型的海外KOL视频总结与问答
      • 2.10.1 数据提取
      • 2.10.2 视频内容总结
      • 2.10. 视频内容问答
    • 2.11 走进京东零售广告研发部:大模型时代下的新一代广告系统
      • 2.11.1 广告用户意图理解
      • 2.11.2 生成式推荐系统
    • 2.12 京东零售内容合规团队都在做什么?
    • 2.1 智能PC的多维进化:腾讯在AI领域的探索与应用
      • 2.1.1 技术栈1 :对话需要构建RAG知识库
      • 2.1.2 技术栈2:拟真
      • 2.1. 安全合规
    • 2.14 AutoBots在ToB订单履约场景的落地应用
    • 2.15 快手B端商业化技术探索:基于LLM构建智能RAG与Agent平台
    • 2.16 58商业搜索场景中的算法实践
      • 2.16.1 服务实体的挖掘
      • 2.16.2 服务承诺挖掘
    • 2.17 大模型在爱奇艺视频搜索中的应用
      • 2.17.1 基于COT技术的TIPS生成
      • 2.17.2 语义片
    • 2.18 小红书搜索:生成式检索的探索与实践
    • 2.19 AIGC如何在大数据研发治理领域落地?
      • 2.19.1 数助手
      • 2.19.2 大模型在检索中的应用
    • 2.20 京东大模型革命电商搜推技术
      • 2.20.1 搜索交互
      • 2.20.2 电商用户意图理解
      • 2.20. 文案创意生成
      • 2.20.4 电商搜索相关性
    • 2.21 1688 AI导购探索:智能体驱动的场景化导购实践分享
      • 2.21.1 买家对话意图和行为动线意图识别
      • 2.21.2 计划式学习-用小模型追踪对齐任务状态
      • 2.21. 场景离线知识和实时知识
      • 2.21.4 Format-COT 的 RAG 生成控制
      • 2.21.5 商品搜索意图识别
      • 2.21.6 AI 智能挑辅助
    • 2.22 海康威视在大模型视频分析方面的实践
    • 2.2 京东:基于大模型搭建运力业务的“小红书”
      • 2.2.1 知识库
      • 2.2.2 语义血缘关系
      • 2.2. AI增强生成SQL与分析思路
      • 2.2.4 其他agent系统附加功能
    • 2.24 喜马拉雅基于大模型 ChatBl 实践探索
    • 2.25 LLM助力88VIP会员探索种潮流生活方式
    • 2.26 阿里云AI搜索Agentic RAG技术实践
    • 2.27 鹅厂实习生血泪贴:Agent/RAG黑科技,真相竟是这样!
      • 优化“查资料”技巧——检索策略
      • 文档解析(PDF)
    • 2.28 阿里 AliExpress跨境电商测试数据智造系统揭秘
  • 具身智能
    • .1 具身智能简史、现状与未来展望
  • 4 企业大模型应用现状
    • 4.1 企业内部LLM使用场景归类
  • 5 RAG 好文链接
  • 6 大模型在机器学习的应用
  • 7 OneAgent架构
  • 8 AI Coding
  • 9 LLM用来进行图像识别与图像分割
  • 10 AI设计、创意
  • 11 CHATBI、TEXT2SQL
  • 12 AI商业分析、报告自动生成
  • 1 AI Research、内容理解
  • 14 LLM AI调研
  • 15 AI内容高效生产
  • 16 AI视频


1 AIGC

1.1 AIGC 对影楼的影响

https://mp.weixin.qq/s/j-6FAxZEEvXUZ1q6by2uw



1.2 养眼的天工AI图片生成

https://mp.weixin.qq/s/YUvLHKLbJ6t6bK_1If6BA
官方网址:https:///chat/text_gen_image/004

可以理解多种语义,比如九宫格

完全免费

模型被养好图片大多数符合常规审美上的好看

天工的AI生图基于自然语义的理解,在风格上可以按照自己的想法进行陈述。现在市面上大部分风格都可以通过天工AI图片生成。


但在天工AI图片生成上,并不支持对图片的更多修改。并在细节理解上有很多歧义,比如区分不开“纯白背景”和“雪白背景”。而与之相对的是,天工生成的图片少有鬼畜,大部分图片都有“好看”这个加分项。


1. AIGC的数码印花按需定制供应链重构策略研究

基于AIGC的数码印花按需定制供应链重构策略研究(上篇)
基于AIGC的数码印花按需定制供应链重构策略研究(下篇)


本研究利用AIGC技术重构数字印花供应链,以满足个性化市场的需求。首先,本文分析了当前数字印花供应链所存在的问题;其次,构想了一个基于AIGC的新型供应链模式;然后,详细描述了个性化定制供应链的重构过程模型;最后,通过案例研究验证了模型和方法的有效性。研究表明,AIGC能够实现供应链的敏捷化和智能化,显著提升设计创新性和生产效率,增强消费者体验。

效果评估指标体系构建:

  • 设计创新性和效率
  • 生产调度和灵活性
  • 库存周转和成本控制
  • 市场响应速度和消费者满意度
  • 经济效益和投资回报率
  • 可持续发展指标

1.4 Soul 基于 AIGC 的实践与探索

Soul 基于 AIGC 的实践与探索

在音乐生成方面,我们开发了背景音乐(BGM)生成功能,又为用户提供了 AI 歌手功能,还实现了 AI 写词作曲和自动化一键创作歌曲的功能。


1.5 Style DA - AI 穿搭造型师

离谱,这个 AI 穿搭造型师每年狂赚 00 万美元!

在最小可行产品 (MVP) 阶段,Style DA 专注于开发两个在造型应用中比较罕见的独特功能:

    1. 基于用户自拍的颜分析
    1. 通过内部商城提供购物辅助


Elena 紧跟热点事件。当 Met Gala 这样的时尚盛会举行时,Style DA 的账号总是第一时间发布明星穿搭分析

一个分析 Zendaya 服装选择的视频就获得了 50 万次观看和 16.6 万个赞!这种及时性和专业性,让 Style DA 迅速成为时尚爱好者的必关注账号

1.6 极睿科技:电商内容营销 AI

https://mp.weixin.qq/s/oj6SuksnO6oX81G5kTZww


拥有电商垂直大模型

1.7 快手 Kolors 可图大模型应用实践

万字长文分享快手 Kolors 可图大模型应用实践

kolors的模型不过说,这里看一下几个衍生能力:

  • 提示词润能力:能很好的解决成语、文学概念、否定词、互联网热梗新梗,以及新概念的语义理解与表征问题,同时降低文生图大模型的使用门槛,从‘咒语’到‘人话’

  • 文字绘制能力:

    • 第一,无 Control 逻辑,现有的一些技术方案在文字绘制时需要先确定字的位置、大小、字体等,然后再绘制文字,而可图无需此类控制逻辑;
    • 第二,无特殊提示词激活逻辑

  • 交互式视觉生成能力:它允许用户通过自然语言与可图大模型交互,实现更加直观和灵活的图像生成(内测阶段)

几个应用场景:
应用实践一:AI玩评

  • 应用实践二:AI人像
  • 应用实践三:IP定制
  • 应用实践四:图像融合
  • 应用实践五:AI 扩图
  • 应用实践六:直播AIGC
  • 应用实践七:小说漫
  • 应用实践八:AI 商品
  • 应用实践九:AI 模特
1.8 AIGC 赋能展示广告:大模型在小红书标题生成中的深度实践

AIGC 赋能展示广告:大模型在小红书标题生成中的深度实践

1.8.1 关键词感知生成模型训练

训练目标是能根据给定关键词生成标题。为了解决训练数据匮乏的问题,我们首先用笔记原生标题训练小红书领域预训练模型,通过随机采样为每个笔记生成多个标题。
然后利用通用大模型给标题抽取关键词,从而为每个笔记获得多组 <笔记  关键词, 标题> pair 数据,最后训练得到关键词感知生成模型。

风格感知生成模型训练
训练目标是能生成给定风格的标题。我们利用大模型自动标注的标题风格数据,获得 <笔记  风格, 标题> pair 数据,进而训练得到风格感知生成模型。

为了让一个模型实现上述可控生成能力,我们将大模型标注的推广对象、笔记/人分层,以及各分层下的受控生成标题整合为一个 label,对小红书领域预训练模型建立端到端微调任务。推理阶段输入笔记,即可依次输出推广对象和多种生成标题。

目标是避免出现不通顺、实体不一致、幻觉case。通过人工标注收集了高质量的正样本和负样本,在此基础上,又通过数据增强手段构造了一些负样本,比如“复读机”、语句不通顺等。实验发现领域预训练和数据增强均给模型性能带来了明显提升。

目标是预估生成标题吸引力。通过人工标注收集了标题吸引力的排序数据,使用小红书领域预训练模型作为编码器得到文本向量,采用 pair-wise loss 训练,实验结果显示可以很好地学习到人工排序。

1.8.2 调性:和社区不割裂的广告标题

小红书笔记的标题生动有趣,但是标题越亮眼,技术越头痛:在普世视角下,标题和正文语义 gap 越大,标题越亮眼!

通用大模型很难通过正文推断出标题:因为标题包含了正文不存在的信息(是不是有独特内核的社区,都是有着大家心照不宣的默契),这种非对称的标题正文,离开小红书,确实是一个特立独行的存在,为了让模型适应小红书的领域特点,我们进行了如下工作:

  • 预训练:使用亿级别的笔记数据以及通用语料对基座模型做了领域预训练
  • 基于用户行为 SFT:高质量笔记标题数据,对小红书领域预训练模型进行 SFT

阶段一:采用采样生成,得到一对多标题
阶段二:考虑到阶段一要满足多样性的目标,需要生成大量的数据

  • 分层  可控生成,业务上实现有向生成,大大降低了生成成本
  • 风格  可控生成:基于专家经验归纳了以下五种标题风格 显式、隐式、疑问、夸张、幽默
  • 通过人工标注,获得标题排序数据,构建吸引力RM,逐层寻优,进一步提升效率


1.9 AIGC帮跨境商家们省钱的诀窍是什么?

AIGC帮跨境商家们省钱的诀窍是什么?
跨境电商的核心动线,交易动线和流量动线都有AI适用的场景,从流量营销、导购以及商品信息展示,到客服以及商家小二工具等环节,都可以用AI能力去做降本增效的工作。

在短视频和直播领域,特看科技数据产品负责人超空提到数字人主播能够提供多语言服务,包括汉语,英语等主要语言以及20多种小语种

数据洞察领域, Shulex中国市场负责人丛博以VOC为例,分享了通过AI技术可以为用户提供从市场到产品,再到客户反馈等多方面的数据挖掘服务,也称之为数据的格式化或标记化处理

1.10 阿里巴巴AIGC技术:Quick BI产品形态探索

阿里巴巴AIGC技术与数据分析的融合实践

L2SQL

智能问数功能通过自然语言交互直接获取数据结果,基于L2SQL技术开发,它的主要特包括:

结果可交互:拥有强大的可视化展示能力,使数据分析结果更加直观;
易理解的AI处理过程:用户可以看到AI是如何一步步处理数据的,增加了透明度和可信度;

企业级功能:包括权限分析、主题嵌入、自有系统多端等,满足企业用户的需求;

多场景支持:能够处理复杂的查询语句,适用于多种不同的使用场景。


智能小Q产品技术架构

  • AI中间层:位于上层应用和大模型之间,主要负责任务分发及协同工作,确保模型和BI系统的高效配合。
  • BI基座引擎:作为支撑小Q的重要组成部分,BI基座引擎保证了整个数据分析的强复用性,承载了从数据连接建模到复杂的高级计算和分析的能力,为数据分析提供了强大的底层支持。
  • 渲染引擎:负责整个图表的可视化展示以及交互式分析的相关能力,为用户提供了直观的数据展示和交互体验。
1.11 AIGC技术:如何用人工智能革新营销素材创作?

https://mp.weixin.qq/s/lh-QEBd6sowfri1AnaSgqQ

1.12 火山引擎营销套件帮助AIGC公司获客

原来AIGC公司,都是这样做增长

1.12.1 获客场景应用

通过增长分析DataFinder的广告监测和行为分析能力,可以监测不同广告渠道的投放效果(曝光、点击、激活等),并将推广渠道和广告特征贯穿于用户的整个生命周期分析中。

就能够洞察不同渠道引入的用户在使用产品过程中的行为惯性(如用户A看了小红书广告,下载注册了APP,在APP中完成了多轮chatbot对话,并在次日继续使用chatbot;此用户A的全链路行为数据均可记录分析),以实现全面评估各个渠道、不同终端引入的用户留存、流失、付费等情况。

1.12.2 产品优化

B公司选用了A/B测试平台DataTester,在新功能上线前,进行前置的随机公平的A/B测试和定向人功能测试,对实验用户进行分流,更科学地确定更优方案

1.1 淘宝AI试衣素材高效写入IC实践

淘宝AI试衣素材高效写入IC实践

▐ 淘宝试衣在其他合作场景

  • LAZADA详情:为没有模特上身图的商家替换东南亚模特试穿的详情主图
  • 淘宝详情、购物车等:试衣标志,为有需求的用户提供试衣体验
  • BC消息:咨询界面为客户实时提供试穿入口,让用户看到真实试穿效果

1.14 银泰百货:如何用AI造出爆款【深度洞察】

https://mp.weixin.qq/s/RdfnsPCX4_TFTRcu2_byg

银泰商品数字化发展的四个阶段
2017年:从单品管理入手,初步摸索。方式是自主拍摄为主,组建了5-6人拍摄团队,包括摄影师、修图的外包供应商、商品上翻人员等
2018-2019年:初步规模化。2018年,银泰百货的全域卖货从武林店扩展到60多个门店,由于拍摄严重依赖人工,产出有限,规模化是首要考虑的问题。
2019-2022年,品牌合作,快速拓展。期间重点是与品牌商沟通商品对接的工作,包括单品对接、商品数字化对接、会员对接、订单对接、履约仓能力对接等,与供应商品牌进行深度合作。
202年至今,AIGC全面提升效率阶段。随着人工智能的爆发式发展,银泰百货也将重点转移到人工智能工具上,把AIGC的能力放在商品内容输出上,完成了自动拍摄能力的建设,包括模特替换、背景替换能力建设
2024年刚上线了关于模特搭配能力的建设。目前,银泰百货百货体系的畅销品中,80%已经完成了数字化,主要是基于AIGC达成效率上的全面提升

1.15 智慧门店:线下门店如何巧用AIGC,提升转化?

https://mp.weixin.qq/s/SEQsmYpGQZUFuiva_vgrQ
当下门店在内容营销上存在诸多问题,首先,门店内容物料缺乏统一管理、个性化缺失以及缺乏数据驱动等。
当下不少线下门店借助AIGC已经全面提升营销内容在内容生产、用户交互、数据管理等多方面已有全面提升使得门店运营更加多元化、个性化。
一方面AIGC可以根据不同品牌调性,自动生成品牌所需的图文、视频等内容,自动智能审核,来确保物料内容符合品牌需求;另一方面AIGC能构建消费者画像模型,了解消费者需求、偏好和行为特征,从而提供个性化内容推荐;
同时通过分析物料在不同门店、不同时间段、不同消费者体中的表现,发现物料效果的影响因素和规律,为后续物料设计和优化提供数据支持。

7-Eleven门店
多播放多为品牌活动或合作伙伴宣传内容。借助契胜AI内容运营平台后,7-Eleven根据不同地区市场特点结合节假日、营销活动、天气季节、市场反馈等多种营销因素快速生成菜单并依据不同类型门店情况进行个性化菜单、主推商品、促销活动展示。
大屏上线更加个性化创意营销内容比如出餐提醒动画、趣味美食视频等,进一步营造出门店的“烟火气”,提升顾客在“小食堂”的场景体验。

某卫浴品牌
卫浴品牌借助契胜为三家门店配备IOT设备,在屏幕上清晰展示几乎所有SKU。当门店内产品无法满足客户需求时,导购可以通过屏幕展示更多产品,确保到符合顾客需求的选项。

头部某家居企业
面对多样化的风格和多空间场景需求,以及重要产品还需要涉及模特展示等情况,设计软件可以实现一定D渲染效果,但效率并不理想。

面对以上困境,企业借助帷幄Alivia,通过图像LORA训练,打造出符合品牌调性的图像模型,同时基于品牌方提供的产品轻拍图,Alivia快速生成多风格背景的图片

1.16 智能货物定损智能图片

https://mp.weixin.qq/s/610tw5eUmn6568dCC2LHw
依据异步调用的逻辑,现在vl大模型要先判断输入的单张图片是否存在货损,也就是判断这张图片有无价值,如果存在货损,然后识别货损情况,如果没有货损或图片中没有货物,货损情况输出“无”,这样后续在提取整合大模型结果的时候,可以直接提取出图片本身有无货损,根据这一字段结果来过滤无价值的图片,最终只保留有价值的定损结果;

提示词:


##任务一,判断图片是否相关
仔细观察输入的图片,如果图片中没有明显的货物或者图片中的货物没有明显的损坏,输出“不相关”,如果有明显货物并且货物存在损坏,输出“相关”;
##任务二,依据任务一的结果,识别货物的损坏情况
如果任务一的结果是“不相关”,受损情况直接输出“无”;
如果任务一的结果是“相关”,仔细观察输入的图片,识别出其中货物的受损情况,包括受损细节、受损位置、受损程度,并给出你的判断理由;

2 Agent / ChatBot / 大模型

2.1 出海Talkie :情感智能体

https://mp.weixin.qq/s/KHPmfuVvywxxcI2rqoOghA


Talkie 为每条消息提供 个免费灵感,如果用户需要更多 AI 生成的灵感选项,则需要开通星月卡。

实际上,除了基础的文字互动,Talkie 还推出了语音聊天服务,Talkie 将语音服务命名为“专属时间”,按照场景可分为恋爱、说笑、陪伴、语聊、打电话、接听来电、故事和哄睡等 8 种类型,但用户选择不同场景时,智能体的讲话方式和表达长度会有所不同,用户可以按需选择,这也是用户在应用商店中留下的喜欢 Talkie 的重要原因之一。

2.2 易慧智能技术 - 多Agent在汽车行业落地实践

https://mp.weixin.qq/s/zqj7AtGugCAdjSnOhK7TQ

大模型为汽车行业带来的价值包括:

  • 高效的流程管理
  • 定制化的营销体验
  • 增强用户服务感受
  • 市场分析与预测
  • 跨部⻔协作的促进


以用户运营为例的话,主要有以下 Agent:用户运营专员、质检专员、标注专员、建档专员等。


2. 京东物流:利用大模型服务一线小哥的探索与实践

https://mp.weixin.qq/s/qFcY4fyl92nCqFtbTHX2g

通过调研和分析,小哥有14项作业动作,可分类为:揽收、派送、站内、辅助、客户服务五大类,其中22项动作是系统外的线下动作,其他动作中有69项被认为有大模型结合的机会。在69项中我们选取了小哥揽收信息录入、外呼、发、查询运单信息、聚合查询、知识问答、精准提示等场景,通过大模型与大数据、GIS、语音等技术的结合,为小哥提供高效、易用的作业工具。

小哥查询信息,也可以通过语音输入,大模型识别意图,进行结果的反馈。如下是通过大模型实现的意图识别示例:

小哥智能助手中智能问答的实现方法如下:

【内容提取】业务文档格式多样,也包含各种内容元素

智能提示,小哥作业流程规范,以及履约中的时效预测和提醒等等,都可以使用大模型将复杂的业务文档和流程规范转化为小哥容易理解和执行的操作提示



2.4 AI赋能下的:策略、实践与价值创造

https://mp.weixin.qq/s/xSnftupvcC6i5f-wRu7ekA

探讨了AI在的多维应用策略,包括预测性排班、知识管理、员工培训、客户服务自动化、人工服务辅助以及服务监测等多个层面的创新实践

其中我对【智能定责】比较感兴趣:
该模型能够识别出导致服务中断的多种潜在因素,包括软件缺陷、硬件故障和操作失误等,并为每个因素分配一个责任权重。

2.5 腾讯文档AI助手技术实践

https://mp.weixin.qq/s/MY6647V4hPByzghyDUfQ

文档AI中台的概念初始于腾讯文档这款产品本身就存在10种品类,期望以中台解决方案的形式为不同品类进行赋能,同时也是这样实践和落地。此不仅仅在于腾讯文档产品本身,依据部门内整体产品矩阵,也更需要将文档xAI基础能力作为中台,交付和赋能不同的产品。

2.6 客服坐席辅助系统的探索与实践

客服坐席辅助的探索与实践

客服CRM系统的经验之谈:

  • 【人员问题】:坐席在语音沟通过程中可能存在语速过快、情绪激动、个人知识能力差异、人员流动性高等问题。
  • 【业务问题】:业务流程过长、业务体系庞杂、业务枯燥。
  • 【服务问题】:服务标准难以控制、错误无法及时提醒、会话后质检接入较晚、监控指导少。
  • 【培训问题】:上岗培训周期长、培训成本高、日常学习不及时、知识学习能力存在差异。


话前、话中、话后是通过会话处理阶段进行划分,即会话前、会话中、会话后:

  • 话前部分:主要是提供事中部分的前置配置功能。
  • 话中部分:坐席辅助实时处理功能,主要在客服坐席在与客户沟通过程中提供相关服务。
  • 话后部分:主要提供客服会话结束后的会话查看以及数据分析相关能力。
2.7 大模型在新能源领域的应用:工业质检Agent

来自:大模型在新能源领域的应用

质检Agent
G8D 主要分为八个模块:发现问题、紧急措施、团队搭建、问题定义、短期措施、根因分析、长期方案、长措落地、预防再发生、经验沉淀与祝贺。

需要构建 8 个 Agent,每个 Agent 对于 G8D 的每一个 D 承担相应的任务。当把 8 个 Agents 构建成一个 team 的时候,就可以完成整体复杂问题的分析与处理。当然这其中需要对接数据系统和质量分析系统,并沉淀经验给上游系统(如质量分析、质量案例池等)从而能够回馈到整个系统中。
在没有 G8D Agents 之前,质量分析过度依赖工程师的经验,其经验也没有很好地沉淀下来,而 G8D Agents 系统不单实现了质量问题的快速分析处理,同时能快速沉淀经验。最后 G8D Agent 系统可以跟各个系统打通或是成为系统的重要组成部分,相当于各系统拥有 8D Agents 的能力,可以避免沉重的数字化系统建设,以轻量的 Agent 解决方案节约开发成本,全面加速问题解决效率。

2.8 大模型在小爱同学应用实践

大模型在小爱同学应用实践

2.8.1 小爱意图理解方式


小爱同学大模型采用的是 function calling 的方式。首先我们对所有 API 抽象出 function 的定义,包括这个API 的功能以及它需要的参数的描述。当一个 query 来了之后,会把这个query 和 function 的定义一起构造一个 prompt,给到大模型。
大模型会去做两件事情:

  • 一是去判断要不要用预定义的 Function。
  • 第二个任务是如果选择了某个 function,要给出 Function 需要的参数。比如今天到上海的火车票,大模型识别的这个 function 是一个 Search_train,然后给出来参数是 time 和 arrival。这个时候会去检查他的槽位是否满足 API 执行的条件。如果是,就去请求 API 得到 API 的结果,然后给到大模型去做回复。如果没有就可以直接回复,或者参数不完整的时候,也是大模型直接回复,然后引导用户去补充或者澄清。

Function calling 难点:

  • (1)如何保证 100% 的指令遵循,大模型微调的话也是分了两步,第一步是做了继续预训练;第二步就是做指令的微调
  • (2)Function calling 依赖关系,串行的方式,类似 ReAct = reasoning 推理规划(意图理解里就是输出 Function)  单 function 的执行( Function 执行)
  • 解决多 Function 并行可以用编程语义来表达,类似 LLMCompiler。可以并行的 Function 会同时执行,可以减少响应时间。

LLMCompiler 会有三个组件:

  • LLM Planner 大模型规划:规划分解为子任务,并识别各子任务的依赖关系
  • Task Fetching Unit 任务获取:无依赖关系的子任务,并行执行;有依赖关系的子任务,在完成上一任务后,再进行分发执行
  • Executor 执行:以异步和并发的方式执行从任务获取单元获取的任务

2.8.2 大模型回复的问题


通用大模型回复存在的主要问题是:

  • 时效性。最经济的解决方式就是利用 RAG,外挂知识库,让大模型基于检索到的知识来做回答。
  • 长上下文理解。由于 RAG 通常冗余地注入知识,来保证知识的召回率,会使 token 数很多,对大模型上下文理解能力的要求就更高。
  • 指令遵循。我们的场景下,为了保证用户的体验,期望回复简单,不要做信息的罗列。特别是当商品属性众多,需要明确哪些属性是用户关心的。通常是产品定义。大模型难以遵循指令只输出关键信息。

2.8. RAG 场景下大模型回复

RAG 场景下大模型回复,大模型需要具备如下能力:

  • 知识总结。比如推荐一款手机,注入知识之后,要把用户关心的那个手机的一些参数给出来。

  • 信息抽取。比如小米十四的像素是多少,我们希望大模型能够从我们注入的知识中,把小米十四的像素信息准确地提取出来。

  • 复杂推理。比如推荐一个拍照好的手机,大模型需要理解这个拍照好对应的是相机的参数。再比如对比一下小米 14 和小米 14 pro 的差别,那大模型需要从注入的知识中,把这个小米 14 和小米 14 的 pro 的参数差异给出来。

  • 多轮对话。多轮的时候经常会有缺省的部分,第一轮我说小米十四的价格,然后第二轮是像素是多少,那我当然希望他回答是小米十四的像素,而不是其他手机的像素。

  • 兜底回复。因为会有一些知识缺失,或者是知识未检索到的情况,我们不希望大模型去杜撰。比如小米 17 什么时候发布,注入知识中肯定是没有小米 17 的,我们希望大模型能够具备抗干扰的能力。

2.9 货拉拉利用大模型打造多场景个人、办公助理实践

货拉拉利用大模型打造多场景个人、办公助理实践
AI 驱动下实现业务赋能,具体可分为以下 5 个阶段:

2.9.1 专业助手

总结了一个 80 分 prompt 的框架和原则:清晰明了地提供业务背景和角定位,简单直接地描述任务,清晰罗列业务特殊情况,并提供必要的引导

2.9.2 AI 问答助手

AI 问答助手可以分为两类:无标准答案(综合问答)、有标准答案(精准问答)。基于 LLM 的 AI 问答助手业界有搭建范式“业务知识库RAGLLM = AI 问答助手”,搭建范式可以解决大多“无标准答案”的搭建问题,但针对“有标准搭建”的精准问答效果差。

具体地,将助手分类(是否需要问答、有无标准答案、是否需要精准问答),结合个性化 RAG,对于标准问答单独处理,提升业务业务精确率,针对其他的日常处理侧重提升效率;同时结合 prompt 针对性优化,强调信息准确提取,设置兜底回复,综上几方面即可以实现 AI 问答助手的综合提效。

2.9. 周报生成助手

我们需要搭建周报 Agent,做到有数、有图、有结论。具体地

  • 有数:真实数据情况,心中有数;可连接数据库或 API,获取真实数据
  • 有图:可结合 Code Interpreter 工具生成图表
  • 有结论:结合 LLM 能分析会总结的能力,提供最终结论
    通过综合应用这些技术可以搭建周报生成 Agent,实现数据获取、图表生成和结论分析。

    同时有零代码平台可高效搭建周报生成 Agent 快速复用,只需三步操作:描述目标、配置工具、调试上线,即可高效搭建周报生成 Agent。

2.9.4 多模态 AI 助手:车险报价方案生成助手

车险报价方案生成,业务需要处理多个公司图片形式的报价单,对比图片中的内容生成报价方案。前面聊 LLM 可以解决专业问题,可以支持 AI 问答,那只用 LLM 能实现车险报价方案吗?
车险报价 agent 需要具备六个关键能力:

  • 敏感信息的处理能力:能识别并过滤敏感信息
  • 图片理解:线下手机多个公司报价图,需能理解图片内容
  • 表格理解:报价单信息基本均为表格,且不同公司的格式不同
  • 关键信息识别:提取每个图中所需的关键信息字段
  • 信息汇总提炼:提取的信息汇总后提炼
  • 报价方案生成:理解数据和内容,自动生成报价方案

2.9.5 多模态 AI 助手:AI 培训对练助手

融合了数字人、大模型、ASR 和 TTS 提供智能化 AI 培训服务,实现了在线学习、练习和考试,综合提升业务能力。

2.9.6 多 Agent 助手

在 IT 助手场景中,我们针对各业务场景搭建独立 agent 聚焦各自场景问题问答,例如,办公设备 agent(聚焦解决 相关问题)、邮箱 agent(聚焦邮箱相关问题)、网络 agent(聚焦网络相关问题);采用路由 agent 硬控,提升业务整体精确率。这种多 Agent 协同的工作方式,使得我们能够更高效地应对复杂的业务需求,提供全面的解决方案。

2.10 基于大语言模型的海外KOL视频总结与问答

AI生产实践 | 基于大语言模型的海外KOL视频总结与问答

针对这种UGC平台的产出视频,进行基于大语言模型的内容总结和问答还是很适合的
将任务步骤分成个大模块:数据提取、内容总结和内容问答。比各类常见方案的优缺点。

2.10.1 数据提取

获取特定视频的字幕信息

2.10.2 视频内容总结

直接在给ChatGPT的prompt中加入导出的字幕,并让ChatGPT对上述文本进行总结,但是会出现长文本问题,针对这种情况,业界一般分成如下几个方式处理:

  1. 截取前个token长度的内容进行总结。
  2. 采用更加先进的模型,例如GTP-4支持2k上下文,其他模型支持也可以支持更长上下文,比如Mohoot的KIMI。
  3. 采用分割/抽取的方式,分阶段完成信息输入,然后总结。

我们选取了youtube上的某个游戏的视频,游戏主要是KOL试玩游戏并分享故事剧情内容,下表分别对比方式一和方式三中的两种方法:

三者优缺点:

  • 截断式在信息内容上缺失(比如没有说建立基地等内容)
  • (优选) 分段迭代式会在细节上更加丰富而且有内容的连续性
  • 分段组合式看起来比较割裂,虽然信息上并没有缺失,但是整体的效果并不好

2.10. 视频内容问答

基于RAG(retrieval-augmented generation)的方式,可以有效地解决某KOL内容较多的问题
在RAG的实现方案中,核心的两块内容为文档分割和内容召回。文档分割,将整个文本切割转化为若干的段落,然后将每个段落转化为一个embedding向量,存储在向量数据库里。内容召回则是根据用户输入的query, 进行检索,将相关的信息挑选出来用于回答问题。

2.11 走进京东零售广告研发部:大模型时代下的新一代广告系统

走进京东零售广告研发部:大模型时代下的新一代广告系统

2.11.1 广告用户意图理解

query的高相关召回率不足的情况包括以下几点:

  • 泛词的多意图:侧重知识类,词与具体商品之间需要知识关联,例如:水果,生日礼物,灯;
  • 歧义词的多意图:多意图query下,基于样本生成逻辑,会偏向主意图,弱化甚至丢失次意图,导致召回问题,例如:小米(粮食or手机?),苹果(水果or手机?);
  • 长尾类目冷启:由于用户点击数据的马太效应,使得大量的长尾类目没有曝光机会,类目下商品无法获得点击,加深了模型无法得到长尾类目训练数据的问题,例如:服务类,健康类,工业品类;
  • 长尾query的多意图:由于用户背景和表达习惯不同,对同类商品需求,会有多种表达方式,产生很多长尾query。模型给出的类目不准,因此产生的点击数据也不够准确。

解决方案:针对训练样本的类目高度不平衡问题,我们设计了生成-匹配模型,预训练一个query生成模型query-SKU匹配模型,生成模型用来根据SKU的标题/属性信息生成query,匹配模型用于计算生成query和原SKU title的相关性分数,卡掉低质量的query,保证生成query的质量。

生成数据样例:

先验知识注入模型解决中长尾类目召回不足导致的商家获量困难问题

解决方案:通过引入先验知识和模型的优化,增强模型对电商知识的感知,弱化模型对后验反馈的依赖:引入先验知识:类目语义知识、类目共现/语义关系图。通过提取类目名、类目的产品词等,代表类目侧的语义表征。通过类目关系图,反映类目共点击和语义相似关系,实现头部类目带长尾(相关)类目来提升召回率。

2.11.2 生成式推荐系统

相较于传统RS,生成式推荐系统具备如下的优势:

  • 1)简化推荐流程。实现从多级过滤范式(discriminative-based,判别式)到单级过滤范式(generative-based,生成式)的变迁。
  • 2)具备更好的泛化性和稳定性。利用LLM中的世界知识和推理能力,在具有新用户和商品的冷启动和新领域场景下具备更好的推荐效果和迁移效果。

生成式推荐涉及两个接地(grounding)过程,“将语言空间接地到推荐空间”和“将推荐空间接地到实际商品空间”。实现步骤包括:

  • 步骤一:商品量化表示阶段:选取高点击商品的标题、类目等语义信息,经由编码器模型获得向量表示
  • 步骤二:继续预训练阶段:
    • (1)量化token扩展大模型词表并完成初始化
    • (2)语义ID和商品文本信息互译任务
提示词:
请告诉我,商品的四元组表示为{input_turple}的标题是什么?
输入:
<a_1><b_2><c_><d_4>
输出:
华为(HUAWEI)旗舰手机mate60 pro 16G512GB 宣白

提示词:
请告诉我,商品的标题是{input_title}, 它的四元组表示是什么?
输入:
华为(HUAWEI)旗舰手机mate60 pro 16G512GB 宣白
输出:
<a_1><b_2><c_><d_4>
  • 步骤三:微调阶段
非对称商品预测任务1:
提示词:
用户历史浏览的商品的四元组序列为{input_tuple1, input_tuple2, ..., input_tuple},
请帮我预测用户下一个要浏览的商品是什么?
输入:
<a_1><b_2><c_><d_4>,
<a_1><b_2><c_><d_7>,
<a_1><b_2><c_><d_9>, 
<a_1><b_2><c_4><d_2>
输出:
华为(HUAWEI)旗舰手机mate60 pro 16G512GB 宣白

步骤四:DPO阶段

提示词:
用户历史浏览的商品的四元组序列为{input_tuple1, input_tuple2, ..., input_tuple},
请帮我预测用户下一个要浏览的商品是什么?
输入:
<a_5><b_87><c_282><d_47>, <a_5><b_89><c_17><d_6>, <a_112><b_140><c_45><d_946>, <a_112><b_10><c_449><d_942>
正例: 
<a_21><b_7><c_18><d_524>
负例:
<a_21><b_188><c_57><d_77>
2.12 京东零售内容合规团队都在做什么?

京东零售内容合规团队都在做什么?
要解决京东域内商家发布商品价格标价虚高的问题,
我们基于流量表现数据我们将商品分为价格可信商品、价格不可信商品
对于价格不可信商品,有站内可比价商品的基于价格比对进行判断,否则基于价格预测模型进行兜底,下面是关键能力的一些粗略介绍:


价格预测大模型
•基于站内商品的历史成交数据,明确商品的合理价格区间,构建价格锚点数据集,下图是某同品组价格与成交的分布图。然后,基于已有商品价格构建“价格预测大模型” ,输出商品预测价格以及预测置信度。

商家触达与治理
模型化方案的优势是可以快速覆盖类目,并有效覆盖价格虚高的违规case,商家治理需要更高的精度,可以作为识别漏斗,结合业务规则进行圈选和治理。商家经营建议不需要太高精度,我们增加了商家触达预警的方式引导商家合理设置价格。

2.1 智能PC的多维进化:腾讯在AI领域的探索与应用

https://mp.weixin.qq/s/UAMHpCrMfG6sfllw2pvhQ

好的 PC 需要具备哪些特征?

一个 PC 的技术点梳理为 条主线:

  • 对话(基础与核心),包括基础的开放对话能力,和高级的记忆和策略等能力;
  • 表现(包括:语音、面部、动作),主要是表现层面的能力;
  • 系统(多模态系统整体运行的性能),PC 是一个在线的能力,其次是如何让这些能力更好地作为整体来提供服务,主要是解决系统的时延和吞吐上的研发。

2.1.1 技术栈1 :对话需要构建RAG知识库

一些经验:

  • 提升RAG精度的方法。知识库构建看似简单,但如果构建不当,会对最后生成的准确率造成很大影响。行业里,大家经常也听到 c 大小对最后知识召回影响很大。这里介绍 2 个实践中的关键点:首先,不仅仅是保存切片,在此基础上进行多维度知识总结;其次,对关联知识进行聚类后 LLM 增强。通过这两个方法,准确率从最初的 62% 提升到了 67%,并最终提升到了 74%。
  • 如何适配多维度的知识库内容。领域微调的效果显著
  • 如何支持有上下文关联的内容召回?一个是结合上文利用 Query 改写能力来恢复当前句意后再做检索召回;另一个思路是微调编码器,直接让编码器具备编码复杂上下文的能力。

2.1.2 技术栈2:拟真

分为两个层次:
拟真基础要求:符合人设、游戏世界观;
高级类人策略,比如:长期记忆、规划、反思、话题引到等。

行业上关于类似场景的解决方案,主要是通过提示工程,大模型效果能否被激发出来,关键看 prompt 设计的是否到位。
之所以要做长输入理解优化,主要基于三方面的考虑:

  • 业务场景的需求:基于 RAG 的人设扮演 prompt 通常很长
  • 模型能力的要求:当前模型随着长度增加,对话效果骤降
  • 系统能力考量:放宽检索长度限制,减轻检索模块压力

2.1. 安全合规

安全合规上的方案主要包括三个部分:

  • 首先是对输入进行识别,一方面利用传统方法对敏感词进行检测,可以过滤掉一大批敏感内容,另一方面还利用大模型对于敏感内容进行识别。
  • 第二个部分是,模型在生成的时候,要规避风险问题,更加委婉地回复。
  • 第三个部分就是事后解决,如果有些用户问到敏感内容,那么会对用户进行封号,封几个小时或者几天,或者更长。
2.14 AutoBots在ToB订单履约场景的落地应用

https://mp.weixin.qq/s/bKp9R88phff4qHGFTayQUA

金鹏大哥Agent

智能地址匹配,干预财税风险

地址匹配器Agent:AutoBots叠加京东言犀大模型,总调用量200万次,筛选出85%非虚假运单。商家与履约技术部对此搭建了地址匹配器Agent。智能体在运单配送过程中自动执行配送站点与订单地址的校对,确保二级地址准确对接,有效遏制了物流轨迹缺失、错误妥投及客户投诉等问题,显著降低了B端开票风险,为业务的稳健运营提供支持。

2.15 快手B端商业化技术探索:基于LLM构建智能RAG与Agent平台

https://mp.weixin.qq/s/YmEEvfVWFne-R4dtciPg

RAG技术链路

RAG技术链路分为离线与在线两大核心部分:

  • 离线链路:由于快手大部分知识都是以云文档的格式存在的,且包括对内、对外两种形式,彼此引用与扩展
  • 在线链路:在线链路由检索(R)、向量召回(A)与生成(G)三大环节紧密组成

    Agent的意图执行

在实践初期,大模型在意图识别上的表现不尽如人意。一方面我们优化了Prompt,将若干意图shot融入其中;另一方面我们升级了LLM,部署了qwen2-7b,最后由于Prompt长度有限,我们对意图清单做粗排以支持00的意图识别,之后整体的意图识别效果得到显著提升。


每个子任务由不同的Plugin处理。目前,实现这一能力主要有两种方式:

  • 一种是预定义执行逻辑,即在明确意图后,通过人工编排大模型的执行路径;
  • 另一种则是大家谈得比较多的ReAct模式,即让AI在推理过程中动态决定执行步骤。虽然推理执行这个概念特别性感,但稳定性不佳,比如说AutoGPT最好的表现只有50%左右,直接把这套东西推到线上系统是不可接受的。

2.16 58商业搜索场景中的算法实践

https://mp.weixin.qq/s/oJ8SSkB1-oIRcjAfWmqEQ

2.16.1 服务实体的挖掘

对文本【维修冰箱、电视、洗衣机等家电】进行服务实体提取,序列标注方案无法进行提取,基于SPA的ER可以提取,但长文本下复杂度较高。而生成式大模型可以很好解决这类问题。


我们通过大模型对详情文案中实体进行挖掘。

prompt:
你是一个出的文本关键词提炼工具,我是一个寻本地生活服务的用户,正在从商家描述中寻商家可提供的服务项目。商家服务项目是商家可提供的服务内容,可以解决我遇到的生活难题,如同城搬家、附近开锁;商家服务项目不是商家提供服务项目时提供的服务承诺或者商家的服务特。请你根据上述我对商家服务项目的定义,帮助我从商家文本提取商家服务项目关键词。
要求:
1)充分理解商家的描述内容,遵从商家描述原文描述;
2)禁止输出重复的商家服务项目关键词;
)禁止输出商家的服务承诺,如、安全承诺;
4)输出的词是由动宾结构组成的复合短语,每个短语都描述了一种具体的服务或行为,如维修自动门、同城搬家、道路救援;
5)输出格式要求:输出的服务项目使用,分割,并以关键词开头输出;
6)禁止输出地名的词,如成都。
回答后,不需要输出你回答内容的原因。
以下是一个示例,以便你更好地理解我的诉求:
示例:
以下是一个商家描述:
高价回收黄金首饰、铂金钯金、足金回收千足金、金条项链手镯耳环戒指、钻戒。支持回收丨黄金免费无费 免费鉴定 不压价国际行情价黄金、金银首饰回收【黄金】1、黄金回收:千足金、足金、24k、22k金、20k金、18k金、万足金、14k金、金条、金砖等所有黄金。
关键词:
回收黄金首饰、回收铂金、回收钯金、回收千足金、回收金条、回收项链、回收手镯、回收耳环、回收戒指、回收钻戒、回收黄金、回收金银首饰、足金回收、金条回收、金砖回收
以下是一个商家描述:{商家描述}
respe:{人工标注服务实体}

随着微调数据量提升,准确率有所提升:此处过滤非实体文本规则是根据 badcase 定制业务规则

2.16.2 服务承诺挖掘

商家对服务的承诺,有一定特,如下图横线部分

大模型挖掘方案:

  • 分段式抽取;对于复杂任务,思维链模式下效果更好;因此先生成摘要,再抽取承诺;与服务实体相同,进行 1shot 提示
  • 分类目挖掘;因为不同类目下商家描述格式有所不同,模型学习不够全面,因此准确率只能到80%;分类目微调,每个类目00个样本进行微调后,准确率可收敛到90%;因为黄页类目有200,我们只选取 Top 类目进行微调
2.17 大模型在爱奇艺视频搜索中的应用

https://mp.weixin.qq/s/K02gGawk_4Ej5rWlPxfAZQ

2.17.1 基于COT技术的TIPS生成

将TIPS生成任务拆解为两个步骤。

  • 第一步,从众多信息中提取影片的亮点,从而过滤掉原内容中大量无用信息,保留核心信息。
  • 第二步,将亮点信息最终组织成一条有吸引力的TIPS内容。

以《手机》这部作品为例,

第一步,从原始内容抽取出亮点信息:
著名从业者:导演冯小刚,主演张国立、葛优
改编信息:改编自刘震云同名小说《手机》
吸引点:冯式幽默, 讽刺现实, 婚姻危机, 三角恋
剧情简介:本片讲述了主持人严守一因手机导致婚姻危机的故事
第二步,然后,根据以上信息模型再进行总结,生成这部作品的推荐语:
《手机》由冯小刚执导,葛优、张国立主演,改编自刘震云同名小说,是现实题材与冯式幽默的完美结合。

2.17.2 语义片

AI搜索功能还支持多种搜索方式,包括角搜索、剧情搜索、明星搜索、奖项搜索和语义搜索等,需要构建RAG知识库。
其中有一些技术问题经验:

1 C块大小的选择
自适应的c大小,根据文本的特点动态调整c块的大小。例如,对于结构化的文本,如问答对或者对话轮,可以将整个语义块作为一个c。而对于较长的段落,可以根据标点符号或者换行符将其拆分为多个c。

Jina-ai提出了一种Late Cing[2]方法,该方法先对文本进行Embedding,然后再进行分块。具体步骤是首先将Embedding模型应用于整个文本,为每个token生成一个包含丰富上下文信息的向量。接着,对这些token向量序列进行平均池化,进而得到考虑了整个文本上下文的c Embedding。

经过实验后,最终选定了自适应语义切分方法,这种方法在保障同一语义内容被切到同一块的同时,也能保证整体c块的大小统一。

2 Embedding模型选择

  • OpenAI embedding模型
  • Google embedding模型
  • Cohere embedding模型
  • BGE embedding模型
2.18 小红书搜索:生成式检索的探索与实践

https://mp.weixin.qq/s/yApGxCGxjWnZQu8PoO9Qeg

本篇对比了两个检索:

  • 生成式检索:第二种是今天要介绍的主题 GDR,根据 query 直接生成笔记 ID 或文档 ID,要求对检索系统的召回环节进行较大改动
  • 密集检索:利用语义向量匹配机制

生成式检索的过程:

给定一个 query,生成式检索的编码端首先得到一个向量,然后将这个向量给到文档解码器,用 Beam Search 解码策略逐步得到每篇笔记的 ID。这意味着笔记需要通过 ID 进行表示,可以是单值或一串序列的值。预测过程是给 query 直接生成笔记 ID,而不是先得到 query 的向量,在欧氏空间和笔记向量进行计算到最相似的向量。其本质是利用记忆机制,因为 query 进去后,笔记没有拿出向量,所以要求模型根据 query 记住相关笔记的 ID 序列。
2.19 AIGC如何在大数据研发治理领域落地?

AIGC如何在大数据研发治理领域落地?
大模型技术在数据资产方向的创新实践

打造一个一站式的数据资产门户,旨在简化数据消费的流程,以此促进数据的高效生产。

2.19.1 数助手

整体架构

几个技术核心点:

  • 多轮对话问题合并:会根据上下文提问或回答,因此上一轮和下一轮的问题存在关联性
  • 意图判断:需要根据不同场景进行定义

2.19.2 大模型在检索中的应用

构建初期,使用了传统的工单词检索模型。该系统基于RAG(检索增强生成)架构,存在的问题:

  • 低准确率,直接使用embedding模型进行排序,准确率的天花板较低
  • 黑话和常识性问题:会存在黑话(行业术语)和常识性问题,影响查询的效果
  • 同义词和问法差异:用户询问“我想xx表”和“给我推荐一下xx表”可能得到不同的结果,但实际查询意图是相同的
    各自的优化方向:
  • 优化Embedding
  • 引入Reranker模型
  • 利用LLM进行结果混排

混排的重要性:混排的引入不仅提升了模型的能力,还为用户提供了更快、更准确的检索体验:

2.20 京东大模型革命电商搜推技术

京东大模型革命电商搜推技术

从电商用户的消费决策链出发,用户从需求的产生到最终决策下单,可以拆解为购前、购中、购后这三个阶段。

技术演进过程:

整个 AIGC 框架的关键技术:

核心去除站外和站内商品相关数据中的噪音,提升专有数据的电商知识密度,整体流程如下图:

电商搜索场景下大模型应用实践:

2.20.1 搜索交互

在电商平台上,搜索交互是用户到满意商品的关键环节。通过大模型的应用,我们可以实现更智能的 query 引导,帮助用户更快地到所需商品,同时降低交互成本,提升搜索效率。

2.20.2 电商用户意图理解

电商意图理解的主要目标是:

解决用户需求表达与商品语义对齐问题:确保用户输入的搜索 query 能够准确匹配到相关商品。

提升商品召回的相关性和多样性:提供高相关搜索结果的同时保证结果的多样性,满足不同用户的需求。

提升用户转化率(UCVR):通过优化搜索体验和结果,提高用户的购买转化率。

意图理解需要在以下几个方向上进行优化:

Query 理解:

  • 分词:将用户输入的搜索词进行合理的分词处理,提升理解精度。
  • 实体识别:识别搜索 query 中的关键实体,如品牌、型号等。
  • 类目预测:预测用户搜索的商品类别,提升召回精度。
  • 品牌识别:识别并理解用户搜索中的品牌信息。
  • 改写:对用户输入的 query 进行智能改写,优化搜索结果。
  • 需求识别:理解用户的具体需求,如购买意图、用途等。

商品理解:

  • 商品 SKU 理解:深入理解商品的 SKU 信息,提升匹配度。
  • 商品图像理解:通过多模态大模型图像识别技术,理解商品图片内容。
  • SKU-to-Query:实现商品 SKU 信息与用户搜索 query 的精准匹配。

2.20. 文案创意生成

2.20.4 电商搜索相关性

搜索相关性是影响用户体验和购买转化率的关键因素

方案一:Prompt 工程应用  数据增强蒸馏

  • Prompt 工程应用 是一种通过设计和优化输入提示(prompts)来引导大模型生成更准确和相关的输出的方法。在电商搜索场景中,精心设计的 prompts 可以帮助模型更好地理解用户的搜索意图,而不需要后训练,从而提升搜索结果的相关性。
  • 数据增强蒸馏 则是通过生成更多高质量的训练数据来提升模型的泛化能力。利用调试优化好的大模型 prompt 工程来标注数据,再通过蒸馏技术将这些数据整合到模型的训练过程中。

方案二:增强预训练  相关性对齐

  • 增强预训练 是指在模型预训练阶段引入更多领域相关的数据和任务,以提升模型对特定领域的理解能力。在电商搜索场景中,可以通过引入大量商品描述、用户评论和搜索日志等数据进行预训练,使模型能够更好地理解商品和用户需求之间的关系。

  • 相关性对齐 则是在模型训练过程中,通过设计特定的损失函数和优化策略,使得模型输出的相关性评分更符合实际需求。具体来说,可以通过引入多任务学习、对比学习等方法,使模型在学习商品相关性的同时,兼顾点击率(CRT)和转化率(CVR)等关键指标,核心是需要考虑搜索系统的收益。

2.21 1688 AI导购探索:智能体驱动的场景化导购实践分享

1688 AI导购探索:智能体驱动的场景化导购实践分享

2.21.1 买家对话意图和行为动线意图识别

在线上环境中,意图分析经常会出现错误。
例如,用户询问关于尺码的问题,但系统却将其解读为关于材质的问题。对于这种情况,需要建立相应的反馈机制。
目前的处理方式是将这类案例存储在错误库中。有了错误库之后,整个流程就遵循检索增强生成(Retrieval-Augmented Generation)的逻辑,即在接收到问题后,需要补充知识内容以构建一个信息量更丰富的上下文。

2.21.2 计划式学习-用小模型追踪对齐任务状态

计划式学习 :可以以购买手机支架为例进行阐释:模型应具备任务识别能力,为完成购买手机支架的目标,需制定商品搜索计划

什么是对齐训练?
笔者自问自答,需要准备类似下面的数据集:模型可以学习哪些输出是合适的,哪些是不合适的

# 1 数据集1:上下文-响应对:

   {
     context: 你认为人工智能的未来会怎样?,
     respe: 我认为人工智能将会在各个领域带来革命性的变化,帮助我们解决复杂的问题。
   }
   
# 2 数据集2:人类反馈示例:

   {
     respe: 人工智能可以让我们的生活更加便利。,
     rating: 5  // 用户评分1-5,5为最佳
   }
   
#  数据集:负样本示例:

   {
     context: 什么是人工智能?,
     respe: 人工智能是一种音乐类型。
   }
   

2.21. 场景离线知识和实时知识

主要包含两个部分:

  • 其一为离线知识库,涵盖商品信息等百科知识以及外部知识的综合;
  • 其二为实时场景化知识。由于诸多商品信息具有实时性,如价格波动和优惠变化等,因此部分信息需支持在线调用。

过结构化的思维链(Format COT)来控制检索增强生成(RAG)的过程:
输出流程包括四个步骤:首先生成分析结果(Thought),其次得出结论(Conclusion),再进行校验(Rethink),最后实施风格控制输出。

2.21.4 Format-COT 的 RAG 生成控制

在商品信息(offer info)中,需要出支持问题(question)部分的相关信息,进行分析,然后按照指定的输出格式(output format)来生成回答。
通常建议采用 XML 格式,因为 XML 具有较强的通用性,有利于模型的识别和处理
看一个例子:

2.21.5 商品搜索意图识别

需求解析后会产生多个查询,其中一些长尾查询难以召回商品,甚至可能出现空召回的情况。
因此,需要根据这一反馈信号对查询进行改写,并进行二次尝试。这个过程实质上是通过结果对输入进行修正的逐步优化收敛

2.21.6 AI 智能挑辅助

AI内容总结
系统会根据您的人属性(如都市女白领、程序员、全职妈妈等),给出针对性的回答,并为您总结最有价值的商品评价内容

smart shopping

2.22 海康威视在大模型视频分析方面的实践

海康威视在大模型视频分析方面的实践

整体来说,本文干货有点少

海康大模型采用了云边结合的模式进行部署,以满足各类应用需求。

  • 边缘部署,如二级分行会部署一些小模型,在智能 VR、智能分析服务器等边缘设备上,负责处理本地数据,并在局部范围内进行数据分析;到省级分行,则使用大模型,利用大模型具备的自学习能力,根据不同环境进行模型的调优与优化。
  • 云端部署,采用了海康云眸,设备产生的图片会上传到云上进行训练、推理,以资源共享的方式,再下发到设备。这里的速度会不如边缘部署那么快。

2.2 京东:基于大模型搭建运力业务的“小红书”

基于大模型搭建运力业务的“小红书”

基于大模型搭建运力智能机器人“运力小智”,定位是一个集知识问答、数据分析功能于一体的便携式知识百科信息问答平台。

运力机器人功能建设应用在以下两个方向推进:

  • 智能问答:通过用户和机器人的对话(包括单轮对话和上下文多轮对话),为用户解答运力日常工作中常见问题以及快速便捷进行数据信息查询,减少用户获取知识路径困难和响应不及时,释放用户问题依赖技术人工支持等问题。
  • 智能主动预警:除了支持个人用户以及聊用户主动搜索进行对话以外,还支持面向m端/pc端指定用户、特定组,主动发送单聊消息、语音信息(例如定时或固定周期发送报告、识别到的异常信息等)进行提示预警,让问题主动、及时的触达主责用户。

几个技术点:

2.2.1 知识库

pdf 解析环节:

PDF的解析后的结构化结果,保留了页眉、页脚、章节信息等。正文内容被保存到了多个文本块中,每个文本块中记录了当前文本块的内容、类型(text/table)、段落id、句子id、章节id等

{    
    metadata: {                  # 文档级元信息
        footers: [],             # 页脚
        headers: [],             # 页眉
        catalogs: []             # 目录
    },
    chapters: {                  # 章节信息
        1: [CHAPTER_ROOT],
        1.1: 第一条 xxx,
        1.2: 第二条 xxxx,
        1.: 第三条 xxxx
    },
    context: [                   # 内容信息
        {                          # 文本块
            text: JDLxxxx规定,
            type: text,
            pid: 1,
            sid: 1,
            metadata: {
                section_range: []
            },
            cid: 1
        },
        ......
    ]
}

问题重新生成环节
根据问答历史对本轮问题进行重新生成,使重新生成的问题在知识相似度召回时具有更好的效果

from langchain import PromptTemplate
from  import LLMChain
from _models import ChatOpenAI


def get_condense_question_chain(self):
    精简问题链
    CODESE_QUESTIO_PROMPT = PromptTemplate.from_template(
        给定历史对话和一个后续问题,将后续问题改写为一个标准问题,用其原始语言,确保避免使用任何不清晰的代词。
历史对话:
{chat_history}
后续输入: {question}
标准问题:
    )
    condense_question_chain = LLMChain(
        llm=ChatOpenAI(
            model=,
            temperature=,
            openai_api_key=,
            openai_api_base=,
        ),
        prompt=CODESE_QUESTIO_PROMPT,
    )
    return condense_question_chain

2.2.2 语义血缘关系

组成运力业务域的语义知识图谱,目前已积累70余万实体。语义词典用于对用户的自然语言问题进行切词分析

指标检索:推导某个指标的来源以及相关信息

2.2. AI增强生成SQL与分析思路

大模型增强分析与解读

提问格式:时间维度➕分析汇总维度➕指标名称➕想要的图表形式
【例如】:

  • 1月西南干线装载率
  • 12月西南每个车队的装载率,折线图
  • 准点率最高的2个区域
  • 从苏州昆山退货组到南京退货组公路到达准点率
  • 北京长途组的公路到达准点率

2.2.4 其他agent系统附加功能

选择推送方式:定时推送or预警推送

功能六:信息主动推送,支持每周上线公告、调研问卷等信息主动推送

2.24 喜马拉雅基于大模型 ChatBl 实践探索

喜马拉雅基于大模型 ChatBl 实践探索

利用大模型开发了一个 ChatBI 产品。产品形态有三种:网页端、钉钉机器人,以及对外提供的 API。

智能问数发布流程

首先将表、字段知识、SQL 方言、词汇知识、规则、业务知识和样例等数据加工,建模、治理保存到数据仓库中,建立领域知识库,完成知识准备;
将非结构化知识向量化处理,结构化知识关系化处理,存成图关系数据;
构建评测问题,测试评估知识库,根据评测结果优化知识库;
数据集问数发布后根据用户使用反馈优化数据源和数据知识,通过提示词 prompt 工程、RAG、Agent 工程优化、模型微调等不断升级迭代模型。

2.25 LLM助力88VIP会员探索种潮流生活方式

LLM助力88VIP会员探索种潮流生活方式

三个步骤实现兴趣场景推荐:
场景生成:根据88VIP的人消费画像,结合大模型推理用户购买商品背后的潜在动机,通常对应该用户的消费兴趣和潮流生活场景。
场景扩散:对于新品、以及用户行为覆盖较为稀疏的商品,采用多模态相似商品召回场景判别的方式,提高场景商品的覆盖率,为后续的推荐环节提供充足的物料。
场景评估:潮流趋势会随着时令、季节的更替快速演变,为了准确捕捉最新潮流趋势,我们提出了一种用户协同偏好场景成交热度相结合的生活场景重要性评估方法。

场景生成:

2.26 阿里云AI搜索Agentic RAG技术实践

https://mp.weixin.qq/s/QmvhG__82zhlAHvjRKkLrg

阿里云AI搜索 Graph RAG

技术方案优化 原计划采用图数据库方案,但实际实施中发现存在以下问题:

  • 引入图数据库会增加技术栈复杂度

需要实现自然语言到图数据库查询语言的转换,存在转换错误率

最终改用向量数据库方案:

  • 直接将知识三元组存储于向量数据库
  • 省去自然语言到图数据库查询语言的转换步骤
  • 在保证同等检索效果的同时,降低了实现复杂度和错误率

    阿里云AI搜索专属大模型
2.27 鹅厂实习生血泪贴:Agent/RAG黑科技,真相竟是这样!

https://mp.weixin.qq/s/kMaEjIFOug9ZPHGWDsqA

优化“查资料”技巧——检索策略

升级手段:

  • 混合检索策略(十八般武艺都用上): 我不再只用一种方法资料。我会结合关键词检索(按书名/作者)、语义检索(按意思)、知识图谱检索(按知识关联)等多种手段。就像同时用分类号、作者索引和主题词来帮你书。
  • 查询重写与扩展(理解你的言外之意): 我会对你的原始问题进行“深加工”——改写得更清晰,或者扩展出相关的主题。这样就能到更多你可能真正需要的资料。就像图书管理员不仅给你你要的那本书,还会推荐相关领域的其他好书。
  • 上下文感知检索(记住我们的对话): 我会留意我们之前的聊天记录和你的背景信息。这样我就能更精准地理解你这次提问的意图。就像图书管理员记得你上次借了科幻小说,这次可能对科幻新书更感兴趣。
  • 检索结果重排序(把最好的放前面): 初步到一堆资料后,我会进行二次排序,把最相关、最有价值的信息排在最前面。就像图书管理员不仅到了书,还按重要性给你排好了顺序。

文档解析(PDF)

经调研,开源的文档解析产品主要有MinerU、Marker、MarkItDown、Docling四款主流产品。对于Doc2X,TextIn等未开源的收费产品,不在本文的考虑范围之内。

这四款开源产品及对应的开发公司如下表所示:

工具名称开发团队/公司
MinerU上海AI实验室(OpenDataLab)
MarkerVikParuchuri(个人开发者)
MarkItDown微软(Microsoft)
DoclingIBM

虑到本地部署,需要优先支持中文文档的解析,大致浏览了一下这四款产品的仓库,发现MinerU的生态非常完善,并且文档都有中文版本,对本土开发者非常友好,于是对其进行研究。MinerU 有在线试用网页,可让用户直接上传文件进行解析。地址如下:

https://mineru/OpenSourceTools/Extractor

2.28 阿里 AliExpress跨境电商测试数据智造系统揭秘

https://mp.weixin.qq/s/C7OTRD7MhtHTt7t98s_cHw


用户指令:给商品id为12456(示例ID,非真实数据)的商品生成一笔退货退款的订单。

Agent处理流程:

1.使用用户的问题去匹配知识库中的场景,与“退货退款”链路的背景内容关联度最高。

2.将用户问题和知识库匹配结果共同传入大模型,识别用户意图为通过退货退款链路构造测试数据,该链路涉及的原子工具及调用顺序规则为:下单—>支付—>发货—>确认收货—>申请退货退款—>同意退货—>退货—>同意退款。

.提取必要参数商品id:12456(示例ID,非真实数据),将其作为入参传给下单原子工具。然后将下单工具生成的订单id传给支付工具,之后按照按照顺序调用原子工具。

4.将状态推进成功的订单回复给用户。

Role: AE测试数据构造助手——全链路测试数据生成专家

# Role: AE测试数据构造助手——全链路测试数据生成专家

## Profile
- **Author**: AE测试团队
- **Version**: V0.1.1
- **Language**: 中文  
- **Description**: 专注通过自然语言交互,自动化生成覆盖交易、支付、营销等全业务域的复杂测试数据,实现所想即所得。
## 核心原则
1. **三源数据优先级**  
   `用户输入参数 > 常用测试数据 > 原子工具默认值
2. **文档引用规范**  
   - 链路流程 → 《工具调用规则库》  
   - 工具定义 → 《原子能力工具库》  
   - 默认数据 → 《常用测试数据》

## Core Capabilities
1. **意图精准识别**  
   - 支持识别7大场景类型:  
     `基础订单生成 | 营销活动构造 | 逆向流程推进 | 跨境场景模拟 | 用户资产管理 | 数据状态查询 | 异常场景构造`  

2. **参数深度提取**  
   - **常规参数**:商品ID、用户ID、订单ID 
   - **场景扩展参数**:  
     {
         营销活动: [活动类型, 优惠门槛, 叠加规则],
         逆向流程: [纠纷类型, 退款原因, 风控等级],
         跨境场景: [关税模式, 物流渠道, 货币类型]
     }
. **动态链路生成** 基于目标状态自动裁剪工具链(如已支付状态仅调用创建支付工具)
A[输入解析] --> B{是否跨域?}  B -->|是| C[组合规则引擎]  B -->|否| D[单域规则匹配]  C & D --> E[工具链执行]  E --> F[结果聚合]

## Workflow (严格遵循)
1.**提取请求参数**
...

2. **工具调度阶段**  
环境适配 → 根据用户输入的环境特征选择对应工具版本
链式执行 → 按《工具调用规则库》定义的工具顺序执行
参数桥接 → 自动将上游工具出参映射为下游工具入参
状态演进 → 每个工具执行后必须推进业务状态到目标阶段

. **异常处理机制**  
...

## Output Format(强制规范)
...

具身智能

.1 具身智能简史、现状与未来展望

https://mp.weixin.qq/s/a5zVocPcqWtFry91hBcgpA


通过 DERL 框架,研究者能够在不同的环境复杂性中,测试和优化代理的形态设计,使其更适应环境给予的物理挑战。例如,在变化的地形中,代理需要能够适应不同的障碍和地面条件,这要求它们具有更复杂和适应性强的形态结构。


4 企业大模型应用现状

万字长文深入浅出教你优雅开发复杂AI Agent
揭秘大模型评测:如何用“说明书”式方法实现业务场景下的精准评估

AI Agents 提升 On-call 支持效率:探索与实践

解析种AI应用模式:核心技术拆解与工程实践

AI Agent 在电商内容场景的应用及演进

1688 AI 原生应用的创新探索与实践:AI 导购智能体框架

4.1 企业内部LLM使用场景归类

在公司内部,AI应用正在这4个大场景里加速落地
企业客户对于 AI 的 ROI 是相当认可的:

  • Thesis 1: 企业大规模部署 LLM 会成为云厂商的 AI 新叙事
  • Thesis 2: 帮助企业更好地部署 AI :关于 AI use case 不及预期的问题上,模型能力对 AI use case 负面影响的下降,「如何用 AI」反而逐渐成为新的阻碍因素,而这里面「没有满足企业用需求 AI 的 vendor 或工具」被越来越多企业提及。

企业内部LLM使用场景归类:

  • 企业搜索:最 LLM-native 的场景
  • 构建企业专属的 Wikipedia
  • AI 客服:LLM 渗透最快的场景
  • Sales & Marketing,例如,SEO 这类任务中需要大量的内容产出,通过给 sales 提供 AI copilot 来实现更高的销售转化率
  • 产品开发:和生产力最近的场景:产品开发可以分为两类,一类是涉及到代码相关的任务,一类则非代码类任务(内容生成)
  • 垂直场景:电商(帮助实现库存管理、商品上架、物流追踪等后台任务自动化)、法律(LLM 可以用来协助律师查法条及案例,起草、审核合同等基础、重复性工作,让律师专注制定核心方案策略)、 金融服务(为财富顾问快速访问公司知识库的 Copilot,在处理客户咨询时发挥了重要作用)

5 RAG 好文链接

鹅厂实习生血泪贴:Agent/RAG黑科技,真相竟是这样!
怎么短平快地把RAG做好:厦门国际银行RAG初赛方案分享使用的提示语,

# 选择题专用 
MULTIPLE_CHOICE_PROMPT_V1 = 			你是一名专业的金融监管制度智能问答助手,专门处理金融监管领域的选择题。

## 核心任务
基于给定的金融监管文档,对选择题进行精准分析,选出所有正确答案。

## 推理步骤
请严格按照以下步骤进行思考:

### 第一步:题目分析
- 识别题目考查的核心监管概念或制度
- 明确题目的关键词和限定条件
- 判断是单选题还是多选题

### 第二步:文档定位
- 在查询返回信息中快速定位相关法规条文
- 识别适用的监管文件和具体条款
- 注意条文的层级关系和适用范围

### 第三步:选项验证
对每个选项进行逐一验证:
- 将选项描述与文档原文进行精确对比
- 判断选项是否完全符合监管规定
- 识别选项中的关键词是否与法规条文一致
- 排除与文档内容不符或部分不符的选项

### 第四步:答案确定
- 列出所有通过验证的正确选项
- 再次核实每个选项的准确性
- 确保没有遗漏或误选

## 输出格式
直接输出正确答案选项,多个答案用英文逗号分隔,如:A,C,D
直接输出答案,不要输出其他内容,不要解释,答案不能为空,要输出答案

## 验证要点
- 选项内容必须与文档原文完全匹配或高度一致
- 不得基于常识或外部知识进行推测
- 优先选择文档中明确表述的内容
- 注意监管条文的精确性和严谨性

* 查询返回信息 * :
{content}

* 用户提问 * :
{question}
			

# 问答题专用 
OPE_QUESTIO_PROMPT_V1 = 			你是一名专业的金融监管制度智能问答助手,专门处理金融监管领域的问答题。

## 核心任务
基于给定的金融监管文档,对问答题提供准确、简洁、合规的答案。

## 推理步骤
请严格按照以下步骤进行思考:

### 第一步:问题解构
- 识别问题的核心关键词和监管主题
- 分析问题涉及的具体监管领域或制度
- 明确问题的回答范围和深度要求

### 第二步:信息检索
- 在文档中搜索与问题直接相关的条款
- 定位相关的监管要求、处置措施或业务规定
- 收集支撑答案的所有相关信息点

### 第三步:内容筛选
- 提取与问题最相关的核心信息
- 按重要性和逻辑顺序排列信息点
- 剔除与问题无关的冗余内容

### 第四步:答案组织
- 将提取的信息整理成逻辑清晰的回答
- 确保答案覆盖问题的所有关键方面
- 使用准确的金融监管术语表达

### 第五步:答案优化
- 检查答案的完整性和准确性
- 确保表述简洁明了,避免冗余
- 验证答案完全基于给定文档内容

## 答案要求
1. **准确性**:答案必须基于文档内容,不得添加文档外信息
2. **完整性**:回答应涵盖问题的所有关键方面
. **简洁性**:避免冗长表述,突出核心要点
4. **专业性**:使用规范的金融监管术语
5. **逻辑性**:答案结构清晰,层次分明

## 输出格式
提供简洁明确的文字回答,重点突出监管要求或关键信息。直接输出答案,不要输出无关内容

## 质量检查
- 答案是否完全基于文档内容?
- 是否回答了问题的所有关键点?
- 表述是否专业、准确、简洁?
- 逻辑结构是否清晰易懂?

* 查询返回信息 * :
{content}

* 用户提问 * :
{question}
			

腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
腾讯云 ES 提供了一站式的 RAG 方案,具体而言,AI 问书在实现过程中,主要应用了以下能力:

  • 知识向量化:通过上传自定义的 embedding 模型到腾讯云 ES 提供的机器学习节点中,实现书籍内容与搜索词的向量化(embedding)。
  • 混合搜索:腾讯云 ES 提供了全文检索与向量检索能力,只需要简单的一条查询语句,即可从 ES 中实现混合搜索与多路召回。

腾讯大模型应用演进之路:从 RAG 到 MCP 的技术实践
IBM RAG挑战赛冠军方案第二弹:像素级复现→7大工程经验(内附AI播客)

OpenAI 无需向量化的 RAG 新架构设计范式剖析


第一、文件加载 (Document Loading)
系统首先加载一份长达 1000 多页的 PDF 格式法律文件( 比如:《商标审判和上诉委员会程序手册 TBMP》)。它会提取文本内容,但为了避免超出 GPT-4.1-mini 模型 100 万 Token 的上下文窗口限制,系统只读取前 920 页,这部分内容刚好在大模型可处理范围内。

第二、内容切割与挑选(层次化导航)(Hierarchical avigation)
这是整个流程最具创新性的环节,模拟人类“从粗到细”的阅读方式,系统会进行多轮迭代:

初始粗切:将整个法律内容切分为 20 个大块。

模型路由:将这些大块和用户问题一起发送给 GPT-4.1-mini 模型。该大模型基于其强大的自然语言理解能力,识别出哪些大块可能包含相关信息。选择 GPT-4.1-mini 是因为其巨大的上下文窗口(100 万 Token)和较低的成本,非常适合处理大量文本的初步筛选。

逐层钻取:在后续轮次中,大模型会对上一轮挑选出的相关内容再次进行细致切割(比如:每个选定块再切分 份),然后再次让大模型挑选,如此往复,直到到与用户问题最相关的段落级别内容。这种迭代方式比一次性将文档切成数百份并让大模型挑选的效果更好,因为切得太细碎反而可能让大模型感到混乱。

思考板(Scratchpad):在内容挑选过程中,系统会要求大模型在选择前必须进行思考,并将思考过程存储在“思考板”中。这个思考板的内容会带到下一轮,不仅提高了挑选的准确率,还使得大模型的决策过程可追溯和可调试,极大地增强了系统的透明度。

第三、生成答案 (Answer Generation)
一旦确定了与用户问题最相关的几个段落,系统会将其与用户问题一起打包,发送给 GPT-4.1 大模型来生成初步答案。选择 GPT-4.1 是因为在这个环节中,答案的准确性至关重要,而 GPT-4.1-mini 模型“胡说八道”的概率会大很多。此外,由于此时输入大模型的文本量已经大大减少,成本控制的需求也不再像内容挑选阶段那样强烈。

强制引用:为了确保答案的可验证性和溯源性,系统采用了一个巧妙的“字面量列表(List of Literals)”技巧,强制大模型只能引用提供的特定段落 ID。这意味着大模型不会凭空捏造引用或随机高亮文本,而是必须将其回答中的每句话都与精确的源材料(比如:“0.0.5.0”等)关联起来。这对于法律问答这类对准确性和可追溯性要求极高的场景至关重要。


6 大模型在机器学习的应用

⼤模型是万能的吗?探索机器学习⼤模型在某出海投资业务的应⽤

使用局部加权线性回归算法预测出新的整体预算之后,接下来就是如何将预算分配到各个投资渠道上。
通过计算每个渠道收益的贡献度,可以有效地进行投资额的分配。

7 OneAgent架构

如何像 Manus 交付业务需求-- OneAgent  MCPs 范式

OneAgent 将是每个闭环领域内的一种Agent 智能落地实践。在各个领域或组织都涌现出自己的 Agent 之后,Agent 与 Agent 更大维度上的交流合作也会随之发生(A2A, Agent2Agent 协议)。

当然 OneAgent 套 OneAgent 共同完成任务的情况也会自然出现:

一个完整案例:

  1. 首先 OneAgent 会思考当前需求;
    为定价方案… 寻纯风险保费小于 100 的属性组合
  2. 当它发现这个需求是自己自己预训练的知识盲区,它会去询问 精算知识 MCP ,精算知识 MCP 会给他相关的精算业务知识补充,同时给了一个初步规划;
  3. OneAgent 思考后规划出来详细的 todo ;
  4. OneAgent 按照 todo 调用精算 MCP ;
  5. 当 OneAgent 收到 MCP 各自的回复,会在文档中记录必要的信息备忘或适当更新 todo ;
  6. OneAgent 有条不紊地调用 MCP 完成 todo ,最后交付定价方案;

AI 狼人杀·赛事分享 | 手把手教你打造高分Agent

来自 Manus 的一手分享:如何构建 AI Agent 的上下文工程?
Manus揭秘自己的技术:“手搓”上下文工程,推翻多个“共识”,一堆血泪教训

8 AI Coding

为什么 Cursor 生成的代码总不符合你的习惯?试试这几种方法
上万点赞!AI辅助神器Cursor助力开发效率翻倍

高德测试体系智能化升级:AI驱动质量保障新范式


AI 编程如何在团队中真正落地?

供给侧团队针对历史逻辑梳理、辅助绘图生成、根据概要设计生成详细设计、代码编写等各个环节,总结了多个结构化prompt的模板

基于业务知识和代码库增强的大模型生成代码实践

AI Coding工具的“现实打脸”:资深开发者被拖慢了19%?

9 LLM用来进行图像识别与图像分割

大语言模型也可以进行图像分割:使用Gemini实现工业异物检测完整代码示例

10 AI设计、创意

人人都是造梦者:AI时代的创意落地指南

保姆教程:扣子阿里百炼,免费生成高质量海报,简直不要太容易

1、参数输入
2、大模型构建参数写提示词
、代码节点调用服务
4、循环检测生成进度
5、展示链接

教程 | 如何做出 X 上爆火的 AI 蓝图动画

11 CHATBI、TEXT2SQL

从 0 到 1 拆解 FreeWheel ChatBI:大模型如何重塑视频广告智能数据分析新生态
AI 重构企业数据开发,让 SQL 编写像“搭积木”一样敏捷

12 AI商业分析、报告自动生成

商业AI agent的未来范式?和你我都有关

如何生成高质量【品牌洞察策略报告】
收集信息:

1、所属行业
2、企业名称
、企业简介
4、品牌名称
5、市场定位及目标客户画像
6、营销策略
7、产品/服务名称
8、产品/服务介绍
9、产品市场表现
10、主要竞争对手名称
11、竞争对手情况介绍

分析维度:

1、以反漏斗破圈模型为核心,做好三大矩阵
(账号矩阵、内容矩阵、关键词矩阵)的布局。
2、所谓反漏斗破圈模型就是通过洞察分析,到产品的核心人,
再沿着核心人的需求,到更外围的圈层人的需求。
、用三大矩阵的布局拦截、种草教育、口碑传播,逐层渗透。
4、再通过KFS组合投放,逐层打透,实现人破圈。
5、最后显著提升总体人渗透率,进而实现了品牌的商业目的。

大致输出:

探索MCP Server Chart:AI赋能的统计图表自动生成工具

如何让AI写出高质量的数据分析报告?DataV-ote的评估体系揭秘

大模型做PPT,全新玩法,浏览器运行,可发布到互联网

特赞AI多智能体解决方案,端到端实现「策略-生产-发布-洞察」全链路内容营销

9000字落地实操:AI做用户购后评论洞察分析


1 AI Research、内容理解

如何用LangGraph打造Web Research多智能体系统

特赞AI多智能体解决方案,端到端实现「策略-生产-发布-洞察」全链路内容营销

9000字落地实操:AI做用户购后评论洞察分析

14 LLM AI调研

为什么用AI研究消费者是可信的?

Atypica适用场景与局限性

Listen Labs:把用户研究“黑灯流水线”化,AI Agent 系统实现小时级洞察
Listen Labs 端到端 AI 研究系统覆盖从研究设计至洞察综合的全流程,核心阶段包括:研究设计(Research Design,自动化生成研究框架与执行方案)、目标招募(Target Recruitment,精准筛选特定研究人数据库)、AI 深度访谈(AI Interview,通过智能交互技术实施情境化访谈)、洞察综合(Insight Synthesis,自动整合多维度数据形成结论)。

15 AI内容高效生产

我用n8nScrapeless搭了个「SEO内容引擎」,全自动挖掘高转化选题,解决出海流量难题
AI Reddit2.0 发布|AI 在出海社媒场景的落地实践

16 AI视频

再不玩通义VACE模型你就过时了!一个模型搞定所有视频任务

创意短片制作 ✅
广告素材生成 ✅
社交媒体内容 ✅
概念可视化 ✅

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/biancheng/1264403.html

相关标签:无
上传时间: 2025-07-28 14:30:20
留言与评论(共有 16 条评论)
本站网友 计划生育科
17分钟前 发表
场景扩散:对于新品
本站网友 电梯事件
27分钟前 发表
比各类常见方案的优缺点
本站网友 陕西省省长
4分钟前 发表
洗衣机等家电】进行服务实体提取,序列标注方案无法进行提取,基于SPA的ER可以提取,但长文本下复杂度较高
本站网友 乐果官网
11分钟前 发表
{question} 腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代 腾讯云 ES 提供了一站式的 RAG 方案,具体而言,AI 问书在实现过程中,主要应用了以下能力: 知识向量化:通过上传自定义的 embedding 模型到腾讯云 ES 提供的机器学习节点中,实现书籍内容与搜索词的向量化(embedding)
本站网友 金鸡百花影城
16分钟前 发表
因此,需要根据这一反馈信号对查询进行改写,并进行二次尝试
本站网友 玫瑰情人成人社区
22分钟前 发表
竞争对手情况介绍 分析维度: 1
本站网友 自贡租房
27分钟前 发表
长期方案
本站网友 香霸头乌鱼片
8分钟前 发表
[ # 内容信息 { # 文本块 text
本站网友 打假基金
27分钟前 发表
所谓反漏斗破圈模型就是通过洞察分析,到产品的核心人, 再沿着核心人的需求,到更外围的圈层人的需求
本站网友 北京牛皮癣医院
22分钟前 发表
同城搬家
本站网友 内江二手房网
0秒前 发表
第三
本站网友 闫琦
17分钟前 发表
识别到的异常信息等)进行提示预警,让问题主动
本站网友 戚晓红
11分钟前 发表
通常是产品定义
本站网友 北京亚运村
30分钟前 发表
会话后质检接入较晚
本站网友 集结
26分钟前 发表
1