Skip to content
📖0 阅读·🤍0 点赞
✨ 推荐关注

关注我的微信公众号

舒一笑的架构笔记

分享更多Java、架构设计、微服务等原创技术内容

了解更多
微信公众号:舒一笑的架构笔记

扫码关注

01
⏱️4 分钟阅读

Recall@K、MRR、NDCG 三指标,一文彻底讲透

面向 RAG 检索评估,系统讲清 Recall@K、MRR 与 NDCG 三个核心指标的定义、差异与适用场景, 帮助你从“能召回”走向“排得准、体验好”的检索质量优化。
02
⏱️6 分钟阅读

为什么你的AI Agent聊着聊着就“跑偏”了?不是模型笨,是7大机制在“作妖”!附8大架构神器,彻底治愈“老年痴呆”

AI Agent 对话中途“跑偏”并非只是不够聪明,而是上下文窗口、记忆机制、工具调用、 规划与状态管理等系统因素叠加导致;本文拆解 7 大根因与 8 类架构解法。
03
⏱️7 分钟阅读

为什么很多人的高蛋白饮食,像一个只配了 Elasticsearch、却没做重排的 RAG 系统?

用 RAG 工程视角拆解高蛋白饮食中的结构失衡问题:主召回很强不等于系统稳定,真正关键在于补齐重排、纠偏与长期鲁棒性的“营养架构”。
04
⏱️5 分钟阅读

重磅!Google 昨晚官宣桌面神器:Alt + Space 一键召唤 AI + 全局搜索,Windows 用户直接起飞!

Google 推出 Windows 版桌面应用,一键 Alt + Space 呼出全局搜索与 Gemini AI 能力,覆盖网页、本地文件与 Drive,实测上手与核心亮点一文看懂。
05
⏱️19 分钟阅读

一文讲透:大模型推理到底在做什么?从 Prefill 到 vLLM,全链路拆解

从“大模型本质是预测下一个 token”出发,系统拆解 Prefill、Decode、KV Cache、 Paged Attention、Continuous Batching 与 vLLM 的工程逻辑,帮助你看懂推理性能和系统设计。
06
⏱️4 分钟阅读

技术圈爆火新词:Harness 工程,OpenAI 和 Anthropic 都在卷这个!

从 OpenAI 与 Anthropic 的最新实践出发,解析 Harness Engineering 的核心:如何通过任务边界、上下文供给、工具权限与反馈闭环,把模型能力转化为稳定可控的企业生产力。
07
⏱️11 分钟阅读

AI 系统落地难的,从来不只是模型:一次企业级部署实施复盘

从一次企业级 AI 平台实施出发,复盘资源规划、中间件协同、业务编排、模型接入与全链路验收,梳理 AI 系统从“能部署”到“可交付”的关键方法。
08
⏱️8 分钟阅读

客户现场没网,Docker 镜像怎么快速部署?我把离线导入导出做成了一键化

客户现场没有外网,镜像仓库拉不下来、部署窗口又很紧时,如何把镜像交付这件事做成 标准化的一键导出、一键导入流程,减少人工操作和现场翻车。
09
⏱️9 分钟阅读

我用 Rust 做了一个跨平台护眼提醒工具 BlinkSpark

长时间盯屏、总是忘记休息、提醒工具又太重太吵,于是我用 Rust 做了一个真正能长期挂着用的跨平台护眼提醒工具 BlinkSpark。
10
⏱️5 分钟阅读

从DAU奴隶到TPD指挥官:春节复工,职场升维指南

从”注意力经济”(DAU)到”生产力杠杆”(TPD)的转变已经发生。AI不抢你的饭碗, 它放大你的杠杆——但只给会指挥的人。职场赢家不是最忙的,而是TPD最高的指挥者。
每页显示:

最后更新于:

💬

评论功能

当前站点为 GitHub Pages 镜像版本,不支持评论功能。

如需发表评论,请访问主域名版本:

🚀 前往 主域名 版本评论
✅ 支持文字评论
✅ 支持图片上传

用代码书写人生 | This site is powered by Netlify

🌙