
AI Agent开发实战㉙|Agent成本优化:如何在效果和成本间平衡Agent上线后,老板一看账单:月均LLM调用成本5万元。效果好是好,但这成本扛不住。如何在不降低效果的前提下,把成本降到2万?一、成本构成分析1.1 成本拆解典型Agent成本构成: LLM调用:70-85% ├─ 意图识别:10% ├─ 检索(Embedding):15% └─ 生成:45-60% 向量检索:5-10% 工具调用:5-10% 基础设施:5-10%优化重点:LLM调用(占70%+)1.2 成本计算classCostCalculator:"""成本计算器"""# GPT-4价格(2026年)GPT4_INPUT_PRICE=0.03# $/1K tokensGPT4_OUTPUT_PRICE=0.06# $/1K tokens# GPT-3.5价格GPT35_INPUT_PRICE=0.0015GPT35_OUTPUT_PRICE=0.002defcalculate_llm_cost(self,input_tokens:int,output_tokens:int,model:str="gpt-4")-float:"""计算LLM调用成本"""ifmodel=="gpt-4":input_cost=input_tokens/1000*self.GPT4_INPUT_PRICE output_cost=output_tokens/1000*self.GPT4_OUTPUT_PRICEelse:input_cost=input_tokens/1000*self.GPT35_INPUT_PRICE output_cost=output_tokens/1000*self.GPT35_OUTPUT_PRICEreturninput_cost+output_costdefestimate_monthly_cost(self,daily_requests:int,avg_input_tokens:int=500,avg_output_tokens:int=200,model:str="gpt-4")-float:"""估算月成本"""daily_cost=self.calculate_llm_cost(avg_input_tokens,avg_output_tokens,model)*daily_requestsreturndaily_cost*30# 示例calc=CostCalculator()monthly_gpt4=calc.estimate_monthly_cost(daily_requests=10000,avg_input_tokens=500,avg_output_tokens=200,model="gpt-4")# 结果:$12000/月monthly_gpt35=calc.estimate_monthly_cost(daily_requests=10000,avg_input_tokens=500,avg_output_tokens=200,model="gpt-3.5-turbo")# 结果:$300/月二、模型选择策略2.1 分层模型架构classTieredLLM:"""分层LLM选择"""def__init__(self):self.models={"cheap":"gpt-3.5-turbo","medium":"gpt-3.5-turbo-16k","expensive":"gpt-4"}defselect_model(self,query:str,task_type:str=None)-str:"""选择合适的模型"""iftask_type:returnself.models.get(task_type,self.models["cheap"])# 根据查询复杂度自动选择complexity=self._estimate_complexity(query)ifcomplexity0.3:returnself.models["cheap"]elifcomplexity0.7:returnself.models["medium"]else:returnself.models["expensive"]def_estimate_complexity(self,query:str)-float:"""估算查询复杂度"""score=0.0# 长度