如何通过 SQL 查询找出每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章?

如何通过 sql 查询找出每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章?

一个 sql 请教

问题:

想通过 sql 查询计算每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章。

步骤:

第一步:已有一张表记录每个用户浏览过的文章(带 id)。

第二步:需要计算每篇文章被哪些用户看过(用户集合)。

第三步:找出这些用户集合中每个用户又浏览了哪些其他文章(使用相同初始表)。

第四步:对这些文章进行统计,计算出现次数最多(关联度最高)的文章。

答案:

方案 1:异步任务统计

对于数据量较大的情况,建议使用异步任务定期统计数据,避免对数据库造成负担。

方案 2:sql 实现

如果非要使用 sql 实现,可以参考以下代码:

-- 页面访问日志表
CREATE TABLE `read_log` (
`content_id` int,
`uid` int
)

-- 每个页面的访问用户访问过的页面在这些用户下的访问次数统计
select
l.content_id as l_content_id, -- 每个需要统计的页面ID,
-- l.uid_list as '访问过 每个需要统计的页面ID 的用户组',
t.content_id as t_content_id, -- 访问过 每个需要统计的页面ID 的用户组 仿问过的需要统计pv的页面ID
count(t.uid) as pv
from read_log t
join (
select content_id, group_concat(distinct uid, '') as uid_list
from read_log
group by content_id
) l on find_in_set(t.uid, l.uid_list)
group by l.content_id, t.content_id
order by l.content_id, pv desc;

注意:

如果需要只取前 n 条数据,需要对结果集进行进一步筛选。

以上就是如何通过 SQL 查询找出每篇文章被哪些用户看过,这些用户还看了哪些其他文章,并统计浏览次数最多的文章?的详细内容,更多请关注其它相关文章!