案例 · 品牌方 · 已交付

市售爆款配方逆向工程 · AI 推测组成 + 成本估算

把竞品的"猜配方"流程从 2 天压到 5 分钟

交付状态

已交付 · 持续订阅

工期

8 周

预算区间

¥35 万

客户类型

本土护肤品牌

客户

本土护肤品牌新品研发团队

挑战

每次跟爆款研发员要花 1-2 天阅读 INCI 列表 + 查公开专利 + 估浓度，准确率参差

方案

Gemini Vision 抓产品标签 → INCI 解析 + 行业浓度区间数据库 + Claude 反推活性物比例 + 专利数据库交叉比对

项目复盘

8 周里我们做了这些

背景

客户是本土护肤品牌（年销 4.5 亿），主力品类是抗衰精华 + 美白面霜。品牌每年发布 30+ 新品，每次新品立项前研发部都要做"竞品逆向"——把市面上 5-8 个对标爆款拆解，看 INCI 列表 / 推测浓度 / 关键活性物 / 单瓶估算成本。现状：每个 SKU 1-2 天工作量，由 1 个研发员 + 1 个跨境采购对照 INCI 列表 + 查公开专利 + 估浓度。准确率参差不齐（同一个产品给两个研发员做出来的"逆向报告"可能差 20%）。30+ 新品意味着 60-90 人天/年浪费在重复劳动。

我们做了什么

总工期 8 周。第 1-2 周｜行业 INCI 浓度区间数据库建设。这是项目的"护城河"——单纯的 LLM 无法精确推测浓度，必须有领域 ground truth 支撑。我们做了三件事：① 200+ 国内外爆款产品（来自 Sephora / Ulta / 天猫 / 抖音 top SKU）人工标注（INCI + 浓度区间 + 包装规格 + 单瓶 BOM 成本）；② 公开专利数据库（Google Patents + 国家知识产权局）爬取 12K+ 化妆品配方专利，每个专利提取 INCI + 浓度配比；③ 200+ 标注 ←→ 12K 专利交叉验证，建立"INCI 在某品类下的合理浓度区间"基准库。第 3-4 周｜Vision 提取产品标签。用户上传产品图片（瓶身 + INCI 列表照片）→ Gemini Vision 提取 INCI 字符串 → match_names 归一对齐 bse_inci → 输出标准化 INCI 列表。这一步对照客户上传的 50 张测试图，准确率 94%。第 5-6 周｜AI 估算浓度区间 + 关键活性物排序。基于 INCI 列表 + 品类 + 包装规格，调 Claude 3.5 Sonnet 推理：① 每个 INCI 的浓度区间（参照 200+ 爆款基准 + 12K 专利）；② 关键活性物按重要性排序（剔除水 / 防腐剂这类"基础辅料"）；③ 整体配方策略归类（如"高活性物 + 低乳化体系"或"经典油包水"）。每次推理走完整 LLM 日志记录。第 7 周｜专利冲突评分 + 单瓶成本估算。专利冲突走 pgvector 检索 12K 专利，找出"包含相似 INCI 组合 + 浓度区间"的专利，输出风险等级（低 / 中 / 高 + 具体专利号）。成本估算用客户的原料采购历史价格 + 包装料估价 + 灌装费 + 检测费综合计算。第 8 周｜灰度上线 + 客户内部培训。

数据结果

上线 5 个月： · 300+ 次逆向调用，覆盖客户全部新品立项 · 浓度区间命中率 78%（与客户内部资深研发员人工估算对比） · 关键活性物识别准确率 92% · 客户研发员平均省 90% 的"竞品研究"时间（从 1-2 天 → 5 分钟） · 2 个高风险专利冲突在产品立项前被提前规避（其中一个原本计划主推的成分组合在某外资品牌专利保护期内） · 客户加签第二期 ¥15 万做"逆向 + 反向推荐"（输入预算 + 目标功效 → 推荐 3 套差异化配方策略）

复盘 · 哪里做得不够

准确率天花板就是 80% 左右——浓度区间是合理猜测不是真值（除非把竞品送 GC-MS 检测）。我们坚持给出"不确定度区间"而不是单一数字（如"15-22%"而非"18%"），反而被客户当作工具的强项——研发员清楚知道哪些是猜测哪些是确定的。逆向工程不是抄配方，是让客户研发员能在 5 分钟看清竞品的"配方策略"，不再被忽悠。这个工具不是替代研发员，是放大研发员的效率——他们用 5 分钟看完工具输出后，可以把节省的 1.5 天投入到自己的差异化创新上。