那个网站教做冰鲜鱼建筑规范app

张小明 2025/12/26 11:50:39
那个网站教做冰鲜鱼,建筑规范app,phpcms套好的网站 放到空间上 后台打开的验证码不能显示,58同城最新招聘网近年来#xff0c;大模型的能力让人惊叹#xff0c;但它也有致命弱点#xff1a;它并不了解你的私有知识库#xff0c;甚至会一本正经地胡说八道#xff08;幻觉#xff09;。 如何让它像一个真正的“内部知识专家”呢#xff1f;答案就是——RAG#xff08;Retrieval-…近年来大模型的能力让人惊叹但它也有致命弱点它并不了解你的私有知识库甚至会一本正经地胡说八道幻觉。如何让它像一个真正的“内部知识专家”呢答案就是——RAGRetrieval-Augmented Generation检索增强生成。本文通过一个贯穿全文的例子从原理到实现、从流程图到代码实战带你真正理解 RAG并能立即应用于你的项目中。一、为什么需要RAG用智能客服举例假设你在为你们公司构建一个智能客服系统用户可能会问下面这个 “TwinFun双人游戏机旗舰XPro” 是我瞎编的并不真实存在“TwinFun双人游戏机旗舰XPro的保修政策是什么”你把问题丢给大语言模型如 GPT / Gemini / 千问 / 豆包 / DeepSeek 等它会信心满满地回答但……答案不一定是真的。因为LLM 并不知道你公司的产品文档它训练数据有限且不包含你的私有内容没查到的时候它会“自动编”也就是根据概率预测这就是典型的幻觉Hallucination。下图是我在某大语言模型平台提问的结果该大模型训练的时候并没有用到 “TwinFun双人游戏机旗舰XPro” 的相关数据所以它的回答都是基于概率猜的不一定是准确的二、RAG 是什么用一句话说明白RAG 全称为检索增强生成Retrieval Augmented Generation 即RAG Retrieval检索 Augmented Generation增强生成核心思想就是用户提问问题时先通过检索私有知识库获取相关的知识将其融入Prompt再让大模型参考相应的知识生成合理的答案先【检索】再【生成】所以叫【检索增强生成】。如果你还不明白用一句大白话说就是让大模型在生成答案之前先查资料再回答不瞎编只说靠谱的。之前看到过一张图比较形象这里贴一下三、RAG的流程落地前一定梳理清楚RAG的流程大致包含两个阶段索引构建数据生成。1. 索引构建索引构建阶段需要做的事情有文档整理通过任何方式文档、网页、数据库等多种来源获取、收集让大模型参考的专业知识的文档通常为我们私有的知识库、公司内部的产品文档等数据切片将长文档按照语义切分成完整的小段如段落或固定大小的文本块以适配模型的上下文窗口向量化使用嵌入模型将每个文本块转换为数学向量即“嵌入”embedding语义相似的文本其向量在空间中也更接近存储将原始文本块和对应的向量存入向量数据库如Chroma, Milvus, Pinecone等以便后续快速检索2. 数据生成数据生成阶段的流程就是上面第2章节末尾那张图中所描述的用户提问使用相同的嵌入模型把用户问题转化为查询向量相似度检索在向量数据库中查找与查询向量最相似的K个文本块重排序可选有时会使用更精细的模型对初步检索结果进行重排序以选出最相关的片段增强将前面步骤检索到的与问题语义相近的文本和原问题打包在一起发送给大模型。通常会用一个包含系统指令、参考资料、原始问题的提示词模板比如你是一位知识助手请根据用户的问题和参考资料生成准确的回答用户问题{query}参考资料{context}请严格基于上述内容作答不要编造信息如果资料中没有答案请回答“文档中未找到相关信息”。生成大语言模型基于构建好的增强提示生成最终回答。模型在生成时会严格依据提供的上下文信息而非仅依赖其内部参数化知识。大幅减少了“胡编乱造”并提升了回答的专业性。实际落地的时候也可以要求模型在回答中引用来源如文档块ID提高可信度。评估与优化可选在实际操作中为确保RAG系统高质量运行需要持续的评估与优化。具体评估指标可以参考检索质量检索到的文本是否相关、答案相关性回答是否解决问题、事实准确性是否与给定的上下文一致等。具体优化手段有查询优化对用户原始查询进行重写或扩展、分块策略优化调整文本块的大小和重叠度避免信息被割裂、多路检索与融合结合关键词检索如BM25与向量检索等。3. 以智能客服举例说明第1章节末尾的例子我向大模型提问的“TwinFun双人游戏机旗舰XPro的保修政策是什么”这个问题它的回答就是胡编的。假如TwinFun双人游戏机旗舰XPro真是我公司的产品我想通过RAG实现智能客服就需要经历以下步骤1文档整理收集公司所有需要智能客服回答的知识比如《TwinFun商贸有限公司双十一活动优惠政策》、《TwinFun双人游戏机旗舰XPro的使用说明》、《TwinFun双人游戏机旗舰XPro的保修政策》等各类文档2数据切片把这些文档的内容切分成多个语义完整的小段比如我把每个文档的内容按照段落进行切片3向量化把切片结果的每个小段都通过向量模型转化为高维向量每个高维向量可以用一个数组来表示4存储把文本和对应的向量一块存入向量数据库5检索用户提问的时候把问题通过相同的向量模型转化为一个高维向量通过这个高维向量在数据库中查询与之语义相近的前N个文本块。6重排然后对这N个文本块进一步筛选排序即通过cross-encoder模型计算这N个文本块与用户问题的相关性分数分数越高语义越接近再取分数较高的几个文本块。7增强、生成把分数较高的文本块和原问题打包发送给大语言模型进行提问最终大语言模型生成的回答就是我们想要的。RAG 实战从文档到最终答案含可运行 Python光说不练假把式下面我们从零开始来实现一套完整的RAG来帮助你更进一步理解RAG的运行流程并在实际业务中落地。1. 前期准备文档这里我准备了三个文档来进行测试TwinFun商贸有限公司双十一活动优惠政策.txt、 TwinFun双人游戏机旗舰XPro的使用说明.txt、 TwinFun双人游戏机旗舰XPro的保修政策.txt。这几个文件已经上传到Githubhttps://github.com/DannyHoo/PublicRepository/tree/master/AI/RAG/rag_intelligent_customer_service访问Github不方便的朋友也可以在公众号“丹尼编程”中回复“rag”关键字进行下载。下载的文件夹中还有一个名为“RAG实现智能客服.ipynb”的jupyter notebook的文件文件中包含全部代码和执行结果。Python环境和依赖Python版本3.12开发环境PyCharm或者Jupyter安装依赖的库uv pip install sentence-transformers chromadb google-genai ollamasentence_transformers是一个基于 Hugging Face Transformers 的 Python 库专门用于将文本尤其是句子或段落转换为高质量的语义向量embeddings。这些向量可以用于衡量文本之间的语义相似度常用于自然语言处理NLP的任务。这里我们主要用于加载embedding模型和cross-encoder模型。chromadbchromadb是一款常用的轻量级向量数据库支持内存/持久化模式。google-genaiGoogle的AI SDK用于调用Gemini模型如gemini-2.5-flash。旧版本的库为google-generativeai2025年12月之后推荐google-genai。官方建议https://ai.google.dev/gemini-api/docs/libraries?hlzh-cnollama用于通过Ollama调用本地运行的大模型。2. 代码实现2.1 数据切片对文档的内容按照段落的维度进行切片from typing import List # 对单个文档按段落切片非空行 def split_doc_into_chunks(doc_file: str) - List[str]: with open(doc_file, r, encodingutf-8) as file: content file.read() # 按换行分割并过滤掉空白段落 return [chunk.strip() for chunk in content.split(\n) if chunk.strip()] # 处理多个文档并合并所有段落 def split_multiple_docs_into_chunks(doc_files: List[str]) - List[str]: all_chunks [] for doc_file in doc_files: print(f正在处理文档: {doc_file}) chunks split_doc_into_chunks(doc_file) all_chunks.extend(chunks) # 合并到总列表 return all_chunks # 为所有文档分片并保存到chunks变量中 doc_paths [ ./docs/TwinFun商贸有限公司双十一活动优惠政策.txt, ./docs/TwinFun双人游戏机旗舰XPro的使用说明.txt, ./docs/TwinFun双人游戏机旗舰XPro的保修政策.txt ] chunks split_multiple_docs_into_chunks(doc_paths) for i, chunk in enumerate(chunks): print(f[{i1}] {chunk}\n)运行之后得到了25个文本片段并保存到了chunks变量中[1] 一年一度的双十一消费狂欢已然开启TwinFun商贸有限公司秉持“感恩回馈让利消费者”的核心理念率先推出面向全体新客户的专属优惠政策活动期间2025年10月24日-2025年11月11日首次注册成为TwinFun会员的消费者无需满足任何消费门槛可直接在会员中心领取一张价值50元的无门槛现金券券有效期与活动周期一致可用于平台内除定制家具、进口奢侈品外的所有品类消费下单时直接抵扣。[2] 针对长期支持TwinFun的老客户公司特别定制了体现专属权益的优惠政策以2025年1月1日-2025年10月23日为统计周期依托CRM系统分析客户消费数据消费金额1万元及以上的高活跃客户直接赠送“1000减300”“2000减700”“5000减2000”满减券各1张消费金额3000元-9999元的潜力客户赠送“500减100”满减券2张15%复购补贴券单笔最高补贴200元消费金额3000元以下的复苏客户赠送“300减50”满减券3张所有券种2025年11月1日-2025年11月11日可用。[3] 为简化购物流程让消费者直观享受实惠TwinFun推出“官方直降一件也打折”的优惠政策10月24日0点起平台内1200款热门商品直接标注双十一折扣价无需凑单、计算满减其中冰箱、洗衣机这几类大家电全场5折空调、热水器全场5.5折潮流服饰、鞋帽箱包类商品直降30%部分断码款式直降50%美妆护肤类商品直降20%且支持叠加品牌优惠券折扣信息在商品详情页实时更新。[4] 聚焦家庭消费场景TwinFun精心设计了“套餐组合更省钱”的优惠政策针对家电、家居、母婴三大品类推出8款主题套餐“厨房焕新套餐”包含指定品牌烟机原价2999元、灶具原价1599元、热水器原价1899元组合价4997元比单独购买立省1500元“亲子成长套餐”包含1-3岁儿童羽绒服2件、益智玩具3套、婴幼儿洗护用品4件套餐价899元较单品总价直降40%所有套餐支持拆分发货下单后48小时内安排出库。此处省略……2.2 向量化把文档的所有的分片都转化为向量这里就需要用到嵌入模型Embedding Model嵌入模型有很多种HuggingFace上列举了各个模型的信息 https://huggingface.co/spaces/mteb/leaderboard它的核心作用是将文本、图片、音频等非结构化数据转化为一串能被计算机理解的 “数值向量”向量维度通常为几百到几千且向量的 “距离” 能反映数据的 “语义相似度” 比如“猫” 和 “狗” 的向量距离会比 “猫” 和 “汽车” 更近。这里我们用shibing624/text2vec-base-chinese这个嵌入模型来进行向量转化from sentence_transformers import SentenceTransformer # 创建一个embedding模型首次加载速度可能较慢需要从Hugging Face上拉取模型 embedding_model SentenceTransformer(shibing624/text2vec-base-chinese) # 定义一个方法embed_chunk用于将某一段文本转化为对应的多维向量返回这段文字所对应的多维向量的数组 def embed_chunk(chunk: str) - List[float]: embedding embedding_model.encode(chunk) return embedding; # 把文档的所有分片结果chunks依次转化为向量并存到embeddings变量中 embeddings[embed_chunk(chunk) for chunk in chunks] print(f所有片段转化为向量数组后的数组数量{len(embeddings)}) print(f第1个向量的维度{len(embeddings[0])}) print(f第1个向量的内容{embeddings[0]})运行之后可以看到这25段文本被成功转化为25个向量每个向量的维度为768向量的内容就是一个长度为768的数组所有片段转化为向量数组后的数组数量25第1个向量的维度768第1个向量的内容[-2.01269060e-01 8.80607814e-02 -2.36491695e-01 3.39772664e-023.34142670e-02 -6.69817388e-01 -4.83846664e-03 7.44304180e-011.19527370e-01 3.21651660e-02 1.63980484e-01 6.63809538e-01此处省略……-3.94228727e-01 4.92302388e-01 -4.49091822e-01 -5.07175863e-01]2.3 数据分片把文本和对应的向量存入向量数据库import chromadb # 创建一个文件型的数据库也可以通过chromadb.EphemeralClient()创建一个内存型的数据库脚本运行结束之后会清除数据 chromadb_clientchromadb.PersistentClient(./db/chroma.db) # chromadb表 chromadb_collection chromadb_client.get_or_create_collection(namedefault) # 把文本及对应的向量保存到向量数据库也可以根据collection的upsert方法按照id更新 def save_embeddings(chunks:List[str], embeddings:List[List[float]]) - None: ids [str(i) for i in range(len(chunks))] chromadb_collection.add( documentschunks, embeddingsembeddings, idsids ) # 调用方法将文本列表及对应的向量列表保存到向量数据库 save_embeddings(chunks,embeddings)初次执行完成后会在db/chroma.db目录下产生数据库文件文本片段和对应的向量就保存在这里2.4 检索当用户提问时需要先把用户的问题转化为一个向量暂且称之为“检索向量”再在向量数据库中查询与之语义相近的前k个向量及文本片段# 定义一个方法用于检索指定文本在向量数据库中语义相近的前k个片段 def retrieve(query:str,top_k:int) - List[str]: # 把查询文本也就是用户提问的问题转化为检索向量 query_embedingembed_chunk(query) # 根据检索向量在数据库中查询语义相近的前k个片段 results chromadb_collection.query( query_embeddings[query_embeding], n_resultstop_k ) return results[documents][0] #questionTwinFun XPro手柄链接不上是什么原因 question哪些渠道购买的TwinFun XPro可享受官方保修主机和无线手柄的免费保修期限分别是多久 retrieve_chunksretrieve(question,5) print(f从向量数据库中查询到的与问题【{question}】语义相近的前n个匹配的结果\n) for i, result in enumerate(retrieve_chunks): print(f{i1}. {result}\n)执行后会发现查询的结果的确都是和问题相关度高的片段从向量数据库中查询到的与问题【哪些渠道购买的TwinFun XPro可享受官方保修主机和无线手柄的免费保修期限分别是多久】语义相近的前n个匹配的结果保修范围与期限界定本保修政策仅适用于通过TwinFun品牌官方商城、线下授权门店及天猫、京东官方旗舰店购买的XPro正品设备非授权渠道购买的设备不享受官方保修服务。核心部件保修期限差异明确主机含主板、芯片、散热模块享受自购买日起2年免费保修无线手柄、双人摇杆控台等标配功能性配件保修1年HDMI线、电源线、充电线等易损耗附件保修期限为3个月。保修起始日期以购机发票开具日期为准无发票时则以设备首次激活日期或电商平台订单生成日期中最早者计算且仅在中国内地不含港澳台区域有效。维修服务保障与规范设备经审核符合保修条件后采取“双向免邮”服务模式用户寄回故障设备的运费由品牌方承担需选择顺丰快递到付维修完成后寄回的运费同样由官方承担。维修周期通常为5-7个工作日若需更换核心部件如主机主板客服会提前通过短信或电话与用户确认部件信息及维修时长征得同意后方可操作。维修后的设备将享受“双重保障”若原保修未到期延续剩余保修时间若原保修已到期自维修完成日起额外提供90天保修服务维修记录可在官方客服中心查询。系统更新与维护在线更新可在“系统设置-系统更新”中手动触发系统会自动检测最新固件更新包大小约500MB-1GB建议在WiFi稳定环境下进行更新过程中主机将自动重启。若在线更新失败可采用USB手动更新在电脑上登录TwinFun官网下载最新固件将其保存至FAT32格式的USB硬盘需新建“XPro”文件夹子文件夹命名“UPDATE”固件文件重命名为“XPROUPDATE.PUP”将USB插入主机USB接口按住主机背面复位键的同时开机待指示灯呈橙色闪烁时松开选择“USB更新”即可。日常维护需每月用压缩空气清理主机散热孔灰尘避免积尘导致过热。延保服务与增值保障为延长设备保障周期用户可在原保修到期前30天内通过官方APP或客服热线购买延保服务。延保费用明确定价主机单独延保1年费用199元延保2年费用349元全套设备主机所有标配配件延保1年费用299元延保2年费用549元。延保服务与原保修范围一致购买后即时生效并与原保修无缝衔接。此外可额外购买“意外保障服务”399元/年覆盖人为摔落、液体泼溅、意外挤压等非人为故障购买后需在48小时内完成设备外观及功能验机备案未备案则保障无效。开箱与部件识别TwinFun XPro标配含1台主机、2个无线手柄、1个双人摇杆控台、1根HDMI 2.1高清线、1根主机电源线、1根摇杆控台Type-C充电线及1份快速指南。主机正面为电源键带指示灯和USB 3.0接口背面依次分布HDMI输出口、电源接口、网线接口及复位键摇杆控台顶部设1P/2P操作键、暂停键底部有6个防滑吸盘手柄则配备方向键、动作键A/B/X/Y及配对键。2.5 重排增强在实际场景中有时候根据向量相似度查询到的片段可能并不是很准确因此可以考虑在检索的时候多查一些比如正常查3条就够了但查5条再进一步通过cross-encoder模型对检索到的片段进行深度匹配和排序然后取分数较高的前3条from sentence_transformers import CrossEncoder # 定义一个排序方法通过cross-encoder模型对用户问题和多个片段之间的相似度打分、排序 def rerank(query:str, retrieve_chunks: List[str], top_k:int) - List[str]: # 创建cross_encoder模型 cross_encoderCrossEncoder(cross-encoder/mmarco-mMiniLMv2-L12-H384-v1) # 用户问题相似片段 列表 pairs[(query,chunk) for chunk in retrieve_chunks] # 用户问题和每个相似片段的重排分数 scorescross_encoder.predict(pairs) # 用户问题每个相似片段 重排分数的列表 chunk_with_score_list[ (chunk,score) for chunk,score in zip(retrieve_chunks,scores) ] # 按照分数倒序排序 chunk_with_score_list.sort(keylambda pair:pair[1],reverseTrue) # 取top k return [chunk for chunk,_ in chunk_with_score_list][:top_k] reranked_chunksrerank(question,retrieve_chunks,3) print(f对匹配结果增强重排后与问题【{question}】语义相近的前n个匹配的结果\n) for i,chunk in enumerate(reranked_chunks): print(f{i1}. {chunk}\n)这里取重排后分数较高的前3条片段看效果是非常符合预期的对匹配结果增强重排后与问题【哪些渠道购买的TwinFun XPro可享受官方保修主机和无线手柄的免费保修期限分别是多久】语义相近的前n个匹配的结果保修范围与期限界定本保修政策仅适用于通过TwinFun品牌官方商城、线下授权门店及天猫、京东官方旗舰店购买的XPro正品设备非授权渠道购买的设备不享受官方保修服务。核心部件保修期限差异明确主机含主板、芯片、散热模块享受自购买日起2年免费保修无线手柄、双人摇杆控台等标配功能性配件保修1年HDMI线、电源线、充电线等易损耗附件保修期限为3个月。保修起始日期以购机发票开具日期为准无发票时则以设备首次激活日期或电商平台订单生成日期中最早者计算且仅在中国内地不含港澳台区域有效。延保服务与增值保障为延长设备保障周期用户可在原保修到期前30天内通过官方APP或客服热线购买延保服务。延保费用明确定价主机单独延保1年费用199元延保2年费用349元全套设备主机所有标配配件延保1年费用299元延保2年费用549元。延保服务与原保修范围一致购买后即时生效并与原保修无缝衔接。此外可额外购买“意外保障服务”399元/年覆盖人为摔落、液体泼溅、意外挤压等非人为故障购买后需在48小时内完成设备外观及功能验机备案未备案则保障无效。维修服务保障与规范设备经审核符合保修条件后采取“双向免邮”服务模式用户寄回故障设备的运费由品牌方承担需选择顺丰快递到付维修完成后寄回的运费同样由官方承担。维修周期通常为5-7个工作日若需更换核心部件如主机主板客服会提前通过短信或电话与用户确认部件信息及维修时长征得同意后方可操作。维修后的设备将享受“双重保障”若原保修未到期延续剩余保修时间若原保修已到期自维修完成日起额外提供90天保修服务维修记录可在官方客服中心查询。2.6 生成生成阶段我们可以依赖不同的大语言模型进行生成。如果需要集成多个不同的大模型可以使用OneAPI等聚合API来实现。下面我们用两种方式来举例说明通过Ollama调用本地运行的大语言模型通过Ollama等方式在本地部署大语言模型如Llama、DeepSeek等、通过SDK调用三方大语言模型Gemini、ChatGPT等。通过Ollama调用本地大语言模型需要先在本地通过Ollama运行deepseek-r1:1.5b这个模型# 通过Ollama的SDK调用本地大模型生成结果 # 本地要先通过Ollama运行大模型 import ollama def generate(query:str,chunks:List[str] )-str: prompt f你是一位知识助手请严格根据用户的问题和参考资料生成准确的回答。 用户问题: {query} 参考资料: {\n\n.join(chunks)} 请严格基于上述内容作答不要编造信息如果资料中没有答案请回答“文档中未找到相关信息”。 print(f{prompt}\n\n---\n) try: response ollama.chat( modeldeepseek-r1:1.5b, messages[{role: user, content: prompt}], ) return response[message][content] except Exception as e: print(fAPI调用失败: {e}) return API调用失败; # 生成测试 answer generate(question,reranked_chunks); print(answer)运行结果如下你是一位知识助手请严格根据用户的问题和参考资料生成准确的回答。用户问题: 哪些渠道购买的TwinFun XPro可享受官方保修主机和无线手柄的免费保修期限分别是多久参考资料: 保修范围与期限界定本保修政策仅适用于通过TwinFun品牌官方商城、线下授权门店及天猫、京东官方旗舰店购买的XPro正品设备非授权渠道购买的设备不享受官方保修服务。核心部件保修期限差异明确主机含主板、芯片、散热模块享受自购买日起2年免费保修无线手柄、双人摇杆控台等标配功能性配件保修1年HDMI线、电源线、充电线等易损耗附件保修期限为3个月。保修起始日期以购机发票开具日期为准无发票时则以设备首次激活日期或电商平台订单生成日期中最早者计算且仅在中国内地不含港澳台区域有效。延保服务与增值保障为延长设备保障周期用户可在原保修到期前30天内通过官方APP或客服热线购买延保服务。延保费用明确定价主机单独延保1年费用199元延保2年费用349元全套设备主机所有标配配件延保1年费用299元延保2年费用549元。延保服务与原保修范围一致购买后即时生效并与原保修无缝衔接。此外可额外购买“意外保障服务”399元/年覆盖人为摔落、液体泼溅、意外挤压等非人为故障购买后需在48小时内完成设备外观及功能验机备案未备案则保障无效。维修服务保障与规范设备经审核符合保修条件后采取“双向免邮”服务模式用户寄回故障设备的运费由品牌方承担需选择顺丰快递到付维修完成后寄回的运费同样由官方承担。维修周期通常为5-7个工作日若需更换核心部件如主机主板客服会提前通过短信或电话与用户确认部件信息及维修时长征得同意后方可操作。维修后的设备将享受“双重保障”若原保修未到期延续剩余保修时间若原保修已到期自维修完成日起额外提供90天保修服务维修记录可在官方客服中心查询。请严格基于上述内容作答不要编造信息如果资料中没有答案请回答“文档中未找到相关信息”。好的我现在需要根据用户的问题和提供的相关片段来回答他们的查询。用户的问题是关于购买TwinFun XPro产品的渠道如何享受官方保修并且想知道主机和无线手柄的免费保修期限分别是多久。首先我会仔细阅读用户的问题部分“哪些渠道购买的TwinFun XPro可享受官方保修主机和无线手柄的免费保修期限分别是多久”这表明用户关心的是不同的渠道包括官方商城、线下授权门店及天猫、京东官方旗舰店购买的产品是否都能享受官方保修以及主机和手柄的保修期有多长。接下来我查看相关片段。保修范围与期限界定部分明确说明本保修政策仅适用于通过TwinFun品牌官方商城、线下授权门店及天猫、京东官方旗舰店购买的XPro正品设备并非授权渠道的产品不享受保修。因此不同渠道都应可以享受官方保修服务。然后核心部件部分详细说明了各部件的保修期限主机含主板、芯片、散热模块自购买日起2年免费保修。无线手柄、双人摇杆控台等标配功能配件1年免费保修。HDMI线、电源线、充电线等易损耗附件3个月保修。这意味着主机和无线手柄的保修期分别是2年和1年。此外手柄的保修时间是1年主机则是2年。我还需要确保回答准确无误并且不涉及编造的信息。根据片段中的内容可以直接引用保修期限的说明以保证答案的准确性。总结一下购买TwinFun XPro的任何渠道均可享受官方保修服务主机的保修期为2年手柄的是1年。购买TwinFun XPro的产品不论通过官方商城、线下授权门店或京东官方旗舰店均可享受官方保修服务。主机的免费保修期限是2年无线手柄的免费保修期限是1年。通过SDK调用三方大语言模型这里调用的Google的gemini-2.5-flash模型如果你调不通比如你遇到诸如这类错误{‘error’: {‘code’: 400, ‘message’: ‘User location is not supported for the API use.’, ‘status’: ‘FAILED_PRECONDITION’}}也可以调DeepSeek等国内的大模型当然都需要提前获取秘钥# 调用Google的Gemini生成结果依赖google-genai from google import genai client genai.Client(api_keyAIzaSyD-l1J5qt0VhDOmLASJPxaG_7If5BXvm8Q) def generate(query:str,chunks:List[str] )-str: prompt f你是一位知识助手请严格根据用户的问题和参考资料生成准确的回答。 用户问题: {query} 参考资料: {\n\n.join(chunks)} 请严格基于上述内容作答不要编造信息如果资料中没有答案请回答“文档中未找到相关信息”。 print(f{prompt}\n\n---\n) try: response client.models.generate_content( modelgemini-2.5-flash, contentsprompt, ) return response.text except Exception as e: print(fAPI调用失败: {e}) return API调用失败; # 生成测试 answer generate(question,reranked_chunks); print(answer)运行结果如下你是一位知识助手请严格根据用户的问题和参考资料生成准确的回答。用户问题: 哪些渠道购买的TwinFun XPro可享受官方保修主机和无线手柄的免费保修期限分别是多久参考资料: 保修范围与期限界定本保修政策仅适用于通过TwinFun品牌官方商城、线下授权门店及天猫、京东官方旗舰店购买的XPro正品设备非授权渠道购买的设备不享受官方保修服务。核心部件保修期限差异明确主机含主板、芯片、散热模块享受自购买日起2年免费保修无线手柄、双人摇杆控台等标配功能性配件保修1年HDMI线、电源线、充电线等易损耗附件保修期限为3个月。保修起始日期以购机发票开具日期为准无发票时则以设备首次激活日期或电商平台订单生成日期中最早者计算且仅在中国内地不含港澳台区域有效。延保服务与增值保障为延长设备保障周期用户可在原保修到期前30天内通过官方APP或客服热线购买延保服务。延保费用明确定价主机单独延保1年费用199元延保2年费用349元全套设备主机所有标配配件延保1年费用299元延保2年费用549元。延保服务与原保修范围一致购买后即时生效并与原保修无缝衔接。此外可额外购买“意外保障服务”399元/年覆盖人为摔落、液体泼溅、意外挤压等非人为故障购买后需在48小时内完成设备外观及功能验机备案未备案则保障无效。维修服务保障与规范设备经审核符合保修条件后采取“双向免邮”服务模式用户寄回故障设备的运费由品牌方承担需选择顺丰快递到付维修完成后寄回的运费同样由官方承担。维修周期通常为5-7个工作日若需更换核心部件如主机主板客服会提前通过短信或电话与用户确认部件信息及维修时长征得同意后方可操作。维修后的设备将享受“双重保障”若原保修未到期延续剩余保修时间若原保修已到期自维修完成日起额外提供90天保修服务维修记录可在官方客服中心查询。请严格基于上述内容作答不要编造信息如果资料中没有答案请回答“文档中未找到相关信息”。根据您提供的信息TwinFun XPro可享受官方保修的渠道包括TwinFun品牌官方商城线下授权门店天猫官方旗舰店京东官方旗舰店通过非授权渠道购买的设备不享受官方保修服务。关于免费保修期限主机含主板、芯片、散热模块享受自购买日起2年免费保修。无线手柄享受1年免费保修。保修起始日期以购机发票开具日期为准无发票时则以设备首次激活日期或电商平台订单生成日期中最早者计算。结果是不是跟你预期的一样呢至此从0到1建造的一套RAG系统就完成了如果想真正消化这些知识就快动手试一试吧。01为什么要对文本进行切片提问的时候把整个文档都丢给大语言模型不行吗1生成阶段给大模型发送的参考信息不能过多原因是大语言模型的上下文长度都有限制信息量太大时模型可能无法读取所有内容2信息越多模型推理成本越高模型推理速度越慢因此“直接把所有文档都一次性丢给大模型”是行不通的同时为了节省token成本提升交互速度在后续提问阶段要尽可能只把相关的知识发送给大模型而不是让大模型参考的越多越好。02为什么要把文本转化为向量直接通过文本搜索比如SQL、ES查询等不行吗通过向量能实现语义搜索。举个例子比如文档中写的内容是“关于增加新能源汽车的行驶里程……”但提问的时候问的是“如何提高电车续航/如何让电车跑的更远”这两段信息字面匹配程度是极低的但意思基本上一样。向量比文本更能表达“语义”从而让模型找到意思相近的内容而不是只匹配字面相近的内容。传统搜索只能按词频、位置打分很难判断“哪段内容最能回答问题”RAG检索不到正确的知识最终答案就不准确。把文本转化成向量后可以按照语义搜索而不是按照关键词。再举个例子比如提问“电脑很卡是什么原因”文档中有“应用性能下降通常由内存不足引起”、“掉帧卡顿是CPU负载过高导致”虽然问题中没有“程序卡顿”这四个字向量表示确能把这些内容理解成“语义相近”。当然有很多embedding模型都支持跨语言比如提问“新能源车怎么充电比较快”但知识库中的文档写的是“Fast-charging methods for EV vehicles”通过合适的向量也能匹配到。还有一个原因在大规模数据下向量搜索速度快。03文本转化为向量的逻辑或者原理是什么呢为什么相似的文本转化为向量后向量相似度也比较高Embedding 模型如 BERT / bge-m3在训练时学的是1句子之间的语义关系2词与词之间的上下文3同义、近义、相关性例如“售后政策”和“保修范围”经常出现在类似的场景“退货规则”和“退款流程”也经常在一起出现。Embedding 模型会把这些语义相近的句子映射到向量空间中邻近的位置Embedding 模型训练目标本质就是“语义相关的句子 → 向量方向接近”“语义不相关的句子 → 向量方向分离”。Embedding 不是天然具有“语义相似 → 向量相似”的特性这种能力是在大规模训练中“学”出来的。04上面实现智能客服例子中用户提出问题后先把根据问题向量从向量数据库中检索到5条结果后又在重排阶段选了3条结果。为什么不在检索阶段直接查3条结果呢理论上也是可以的我们完全可以直接在检索阶段直接查少量数据比如3条结果给大模型参考或者在干脆检索阶段查多查一些比如5条结果都扔给大语言模型用来参考但检索重排结合的方式才是最优解。在 RAG 中初步检索通常依赖向量相似度搜索它的优势是 速度快、成本低能在海量数据里迅速找到「大概相关」的候选片段。但这种方法属于粗粒度匹配难免会出现排序不准的问题——例如一些文本词相似但语义不相关却仍然排在前面。因此需要引入 重排Rerank阶段 来做更精细的语义判断。重排通常使用更强的模型如 Cross-Encoder、Cross-BERT逐条对「查询 文档片段」进行深度语义匹配重新计算相关性得分把真正高相关的片段排到前面。它能显著提升最终回答的质量和可靠性。不过重排模型的计算成本比向量检索高得多速度较慢、单条计算耗时更长因此只用于对“初检后的少量候选”进行精排而不会直接对整个知识库操作。用个更形象的例子来比喻——招聘你可以把检索阶段理解为公司筛选简历把重排阶段理解为安排面试和入职。想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容​一、学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI1. 100本大模型方向电子书2. 26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC 实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。3. 600套技术大会 PPT听行业大咖讲实战PPT 整理自 2024-2025 年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。二、求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌1. 107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自 2021-2025 年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析2. 102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑3. 97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”三、路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇 【录播课】四、资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容​2025 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

新闻类网站开发难点义乌做公司网站

第一章:MAUI自动化测试概述.NET MAUI(.NET Multi-platform App UI)是微软推出的跨平台应用开发框架,支持开发者使用C#和XAML构建运行在Android、iOS、macOS和Windows上的原生应用。随着应用复杂度提升,确保功能稳定性和…

张小明 2025/12/24 18:10:09 网站建设

中山seo排名优化湖南专业seo优化

基于荧光素酶(luciferase)的发光原理,科学家发明了双荧光素酶报告基因检测系统。该系统包括萤火虫荧光素酶(Firefly luciferase)和海肾荧光素酶(Renilla luciferase)。两者可催化各自的底物发生…

张小明 2025/12/24 18:08:08 网站建设

网站开发顶岗实习报告四川省人事考试网

ELANA是由得克萨斯大学奥斯汀分校开发的轻量级LLM能效与延迟分析工具。支持多GPU与边缘设备,兼容Hugging Face所有模型,可分析模型大小、缓存占用、预填充延迟(TTFT)、生成延迟(TPOT)、端到端延迟(TTLT)及能耗数据。提供细粒度内核级分析,支持…

张小明 2025/12/24 18:06:07 网站建设

关于企业网站建设数据现状分析怎么打开google网站

5G及未来的物理层安全设计 1. 物理层安全性能衡量 实际的保密性能可以通过合法节点和非法节点的错误概率率(如误包率PER和误比特率BER)之间的差异来获得。此外,安全吞吐量和保密信道容量可以直接与PER和BER相关联。在衰落环境中衡量保密性时,当非法接收者(Eve)的信道未…

张小明 2025/12/26 4:05:34 网站建设

网站推广有哪些常用的方法网络公司构建网站

1 引言 毕业设计是大家学习生涯的最重要的里程碑,它不仅是对四年所学知识的综合运用,更是展示个人技术能力和创新思维的重要过程。选择一个合适的毕业设计题目至关重要,它应该既能体现你的专业能力,又能满足实际应用需求&#xff…

张小明 2025/12/25 19:22:10 网站建设

加强主流网站集群传播能力建设中国已封城市名单

FaceFusion在游戏开发中的实验性应用:NPC面部动态生成 在现代游戏设计中,一个NPC(非玩家角色)是否“有灵魂”,往往取决于他的一颦一笑是否自然、情绪变化是否贴合情境。过去,这些细腻的表现依赖昂贵的动作捕…

张小明 2025/12/24 18:00:00 网站建设