案例 · 品牌方 · 已交付

市售爆款配方逆向工程 · AI 推测组成 + 成本估算

把竞品的"猜配方"流程从 2 天压到 5 分钟

交付状态
已交付 · 持续订阅
工期
8 周
预算区间
¥35 万
客户类型
本土护肤品牌
客户

本土护肤品牌新品研发团队

挑战

每次跟爆款研发员要花 1-2 天阅读 INCI 列表 + 查公开专利 + 估浓度,准确率参差

方案

Gemini Vision 抓产品标签 → INCI 解析 + 行业浓度区间数据库 + Claude 反推活性物比例 + 专利数据库交叉比对

项目复盘

8 周 里我们做了这些

背景

客户是本土护肤品牌(年销 4.5 亿),主力品类是抗衰精华 + 美白面霜。品牌每年发布 30+ 新品,每次新品立项前研发部都要做"竞品逆向"——把市面上 5-8 个对标爆款拆解,看 INCI 列表 / 推测浓度 / 关键活性物 / 单瓶估算成本。 现状:每个 SKU 1-2 天工作量,由 1 个研发员 + 1 个跨境采购对照 INCI 列表 + 查公开专利 + 估浓度。准确率参差不齐(同一个产品给两个研发员做出来的"逆向报告"可能差 20%)。30+ 新品意味着 60-90 人天/年浪费在重复劳动。

我们做了什么

总工期 8 周。 第 1-2 周|行业 INCI 浓度区间数据库建设。这是项目的"护城河"——单纯的 LLM 无法精确推测浓度,必须有领域 ground truth 支撑。我们做了三件事:① 200+ 国内外爆款产品(来自 Sephora / Ulta / 天猫 / 抖音 top SKU)人工标注(INCI + 浓度区间 + 包装规格 + 单瓶 BOM 成本);② 公开专利数据库(Google Patents + 国家知识产权局)爬取 12K+ 化妆品配方专利,每个专利提取 INCI + 浓度配比;③ 200+ 标注 ←→ 12K 专利交叉验证,建立"INCI 在某品类下的合理浓度区间"基准库。 第 3-4 周|Vision 提取产品标签。用户上传产品图片(瓶身 + INCI 列表照片)→ Gemini Vision 提取 INCI 字符串 → match_names 归一对齐 bse_inci → 输出标准化 INCI 列表。这一步对照客户上传的 50 张测试图,准确率 94%。 第 5-6 周|AI 估算浓度区间 + 关键活性物排序。基于 INCI 列表 + 品类 + 包装规格,调 Claude 3.5 Sonnet 推理:① 每个 INCI 的浓度区间(参照 200+ 爆款基准 + 12K 专利);② 关键活性物按重要性排序(剔除水 / 防腐剂这类"基础辅料");③ 整体配方策略归类(如"高活性物 + 低乳化体系"或"经典油包水")。每次推理走完整 LLM 日志记录。 第 7 周|专利冲突评分 + 单瓶成本估算。专利冲突走 pgvector 检索 12K 专利,找出"包含相似 INCI 组合 + 浓度区间"的专利,输出风险等级(低 / 中 / 高 + 具体专利号)。成本估算用客户的原料采购历史价格 + 包装料估价 + 灌装费 + 检测费综合计算。 第 8 周|灰度上线 + 客户内部培训。

数据结果

上线 5 个月: · 300+ 次逆向调用,覆盖客户全部新品立项 · 浓度区间命中率 78%(与客户内部资深研发员人工估算对比) · 关键活性物识别准确率 92% · 客户研发员平均省 90% 的"竞品研究"时间(从 1-2 天 → 5 分钟) · 2 个高风险专利冲突在产品立项前被提前规避(其中一个原本计划主推的成分组合在某外资品牌专利保护期内) · 客户加签第二期 ¥15 万做"逆向 + 反向推荐"(输入预算 + 目标功效 → 推荐 3 套差异化配方策略)

复盘 · 哪里做得不够

准确率天花板就是 80% 左右——浓度区间是合理猜测不是真值(除非把竞品送 GC-MS 检测)。我们坚持给出"不确定度区间"而不是单一数字(如"15-22%"而非"18%"),反而被客户当作工具的强项——研发员清楚知道哪些是猜测哪些是确定的。 逆向工程不是抄配方,是让客户研发员能在 5 分钟看清竞品的"配方策略",不再被忽悠。这个工具不是替代研发员,是放大研发员的效率——他们用 5 分钟看完工具输出后,可以把节省的 1.5 天投入到自己的差异化创新上。

逆向工程不是抄配方,是让客户研发员能在 5 分钟看清竞品的"配方策略",不再被忽悠。
CosDev · 周伟
技术栈
Gemini VisionClaude Sonnetpgvector专利交叉数据库Python

想做类似的项目?

把你的情境告诉我们,48 小时内给到初步方案 + 报价区间。