
我们先分析各个选项的逻辑与合理性。
A:
“根据用户分享的文章,是有可能分析并得到用户的真实信息”
这是合理的,因为用户发帖内容可能包含地理位置、职业、年龄、人际关系等,通过数据挖掘和交叉分析可能推断出真实身份。
B:
“必须要登录才可以查看网站的数据”
对于水木社区(newsmth.net),大部分版面内容无需登录即可浏览(部分敏感版面需登录),因此“必须登录”这一说法并不准确,所以此项不合理。
C:
“全站抓取,首先分析首页有多少个讨论区板块,然后再分析每个板块下的文章列表,最终获取每篇文章的详情内容”
这是典型的网站爬取流程,合理。
不合理的是 B。
答案:B