第(2/3)页 页面上的缩略图太小太密集,根本看不清具体内容,而且这种网站的弹窗广告多得吓人,万一装了什么奇怪的插件就完了。 她换了个思路。 与其在这个破网站上一页一页翻,不如直接从本地入手。 苏羽新开了一个记事本窗口,手指在键盘上飞快地敲了起来。 不到十分钟,一段小爬虫脚本写好了。 功能很简单,抓取浏览器本地存储的历史输入记录和缓存数据,按照访问频率和停留时间排序,然后把所有视频类链接单独提取出来。 苏羽对自己的技术还是有信心的。 毕竟,这种小工具对一个写了三年代码的运营转开发来说,也就是几行pythOn的事。 脚本跑起来,终端窗口里的日志刷刷地滚。 大概三分钟,结果导出来了。 一个tXt文件,按时间排序,列着顾风最近三个月在那个网站上看过的所有内容。 标题、链接、停留时长,一目了然。 苏羽把文件拖到编辑器里,开始从上往下看。 第一个标题她就看不下去了。 太直白了。 日语的标题就这样,什么都往名字里写,不留任何想象空间。 苏羽的脸红了一下,又迅速压下去。 她告诉自己,这是市场调研,不需要害羞。 她以前在C市的那家公司做运营的时候,不也是要分析用户画像、研究目标群体的偏好模型吗? 现在不过是把研究对象换成了顾风而已。 本质上是一样的。 苏羽安抚好自己,重新开始看。 这一次她逼着自己忽略掉标题里那些让人脸热的措辞,只关注关键词。 她在记事本里新开一列,把高频出现的标签和关键词摘了出来。 看了大约二十多条之后,一些规律开始显现。 首先,顾风看的绝大多数不是真人,是动漫。 苏羽数了数,真人视频只占总数的不到百分之十,而且停留时间都很短,最长的一条也才四分钟。 动漫则不一样,不少都看完了全集。 这个特征跟她对顾风的判断吻合。 顾风喜欢二次元,从高中开始就是。 第(2/3)页