AI 时代的核心竞争力
一个新用户刚注册,没有任何历史行为数据,系统怎么给他推荐内容?这是推荐系统的"第一印象"问题。
第一印象决定留存:
数据积累:冷启动做得好,能更快积累用户行为数据,后续推荐就越精准
从千万级的大数据池子里,快速筛选出用户可能感兴趣的几千个候选内容
1000万条内容 → 召回 5000条候选
目标:快速、高召回率,不错过用户可能喜欢的内容
用精密算法对召回的几千个内容进行打分排序,选出 Top 10 展示给用户
5000条候选 → 打分排序 → Top 10 展示
目标:精准预测用户喜好,最大化点击率/时长
在排序结果基础上进行业务规则调整,优化最终展示效果
Top 10 排序 → 业务规则 → 最终展示
目标:平衡业务目标,提升用户体验
推荐系统为了提高 CTR,不断给用户推类似内容,导致用户视野变窄,最终被困在"茧房"里,接触不到多元化信息。长期来看,这会导致产品生态恶化。
Exploitation(利用):基于已知偏好推荐,追求短期 CTR
Exploration(探索):尝试新内容,挖掘潜在兴趣,追求长期留存
平衡策略:ε-greedy、Thompson Sampling、UCB 算法
经验值:通常 80-90% 利用 + 10-20% 探索
在训练集和测试集上计算
局限:离线好不一定线上好
A/B 测试验证
关键:最终看业务指标提升
推荐系统不能只优化点击率
技术:MMOE、PLE、帕累托最优
召回 500 家候选餐厅
选出 Top 20 餐厅
最终展示 10 家餐厅给用户
"如果推荐系统的 CTR 突然下降了,你怎么排查?"
回答思路:
"如何平衡推荐的精准性和多样性?"
回答思路:
"推荐系统怎么评估效果,除了 CTR 还看什么?"
回答思路: