如何通过 SQL 查询找出每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章?
一个 sql 请教
问题:
想通过 sql 查询计算每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章。
步骤:
第一步:已有一张表记录每个用户浏览过的文章(带 id)。
第二步:需要计算每篇文章被哪些用户看过(用户集合)。
第三步:找出这些用户集合中每个用户又浏览了哪些其他文章(使用相同初始表)。
第四步:对这些文章进行统计,计算出现次数最多(关联度最高)的文章。
答案:
方案 1:异步任务统计
对于数据量较大的情况,建议使用异步任务定期统计数据,避免对数据库造成负担。
方案 2:sql 实现
如果非要使用 sql 实现,可以参考以下代码:
-- 页面访问日志表 CREATE TABLE `read_log` ( `content_id` int, `uid` int ) -- 每个页面的访问用户访问过的页面在这些用户下的访问次数统计 select l.content_id as l_content_id, -- 每个需要统计的页面ID, -- l.uid_list as '访问过 每个需要统计的页面ID 的用户组', t.content_id as t_content_id, -- 访问过 每个需要统计的页面ID 的用户组 仿问过的需要统计pv的页面ID count(t.uid) as pv from read_log t join ( select content_id, group_concat(distinct uid, '') as uid_list from read_log group by content_id ) l on find_in_set(t.uid, l.uid_list) group by l.content_id, t.content_id order by l.content_id, pv desc;
注意:
如果需要只取前 n 条数据,需要对结果集进行进一步筛选。
以上就是如何通过 SQL 查询找出每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章?的详细内容,更多请关注其它相关文章!