AI联网搜索时的prompt小技巧 随着今年DeepSeek的爆火,结合去年至今KIMI、通义千问、豆包大模型的快速发展,在日常工作中,很多同学都养成了“遇事不决,AI来答”的良好习惯。 技术开发 2025年03月25日 0 点赞 0 评论 83 浏览
如何监控vLLM等大模型推理性能? 近两年来,随着大语言模型(LLM)的快速普及,AI 推理应用的需求呈指数级增长。以 DeepSeek 为代表的开源大模型凭借其卓越的推理性能和准确性,在开发者社区中迅速走红。 技术开发 2025年03月18日 0 点赞 0 评论 84 浏览
性能比肩最强开源,QwQ-32B一键部署,百万Token免费送! 百炼平台提供的标准化 API 接口,免去了自行构建模型服务基础设施的麻烦,并支持负载均衡及自动扩缩容,确保了 API 调用的高稳定性。 商业产品 2025年03月19日 0 点赞 0 评论 111 浏览
记一次内存利用率问题排查 本文详细记录和分析了在应用升级到JDK 11后,由于堆外内存(Direct Memory)管理策略的变化导致的内存利用率告警问题。 技术开发 2025年02月26日 0 点赞 0 评论 124 浏览
23招教你掌握大模型提示词技巧 推理成本直降80%的Deepseek-R1横空出世,OpenAI对GPT-4o进行了迭代更新,马斯克的xAI推出Grok 3模型并声称性能超越ChatGPT ......在这场技术地震中,最引人注目的当属完全开源的DeepSeek。 技术开发 2025年03月17日 0 点赞 0 评论 129 浏览
主流多智能体框架设计原理 本文描述了关于智能体(Agents)和多智能体系统(Multi-Agent Systems, MAS)的详尽介绍,涵盖了从定义、分类到具体实现框架的多个方面。 技术开发 2025年03月14日 0 点赞 0 评论 132 浏览
如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型 近期,阿里云百炼平台重磅推出 DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B 等 6 款模型,为用户提供了新的选择。《100万免费 Token!DeepSeek-R1满血版即刻拥有》 技术开发 2025年02月13日 0 点赞 0 评论 137 浏览
系统稳定性建设三件事 为了更好地推进系统稳定性建设,我们首先要理解系统稳定性的真正含义。简单来说,系统稳定性是指系统在受到外部干扰而偏离正常运行状态后,能够在干扰消除后自动恢复到初始运行状态的能力。这种能力反映了系统的弹性和自我修复能力。 技术开发 2025年02月18日 0 点赞 0 评论 146 浏览