网站统计逻辑

WEBtongjiluoji

流程1:浏览器向网站Web Server发起请求URL。

流程2:网站Web Server解析请求URL并生成Html文档响应返回给浏览器。

流程3:浏览器解析Html文件,加载外部脚本、样式表和图片等,触发JS统计代码。

流程4:解析并执行JS脚本,请求数据收集脚本。通过浏览器内置JS收集域名、URL、页面标题、分辨率、客户端语言、referrer、cookie(如果在此用户浏览器种过cookie,则能获取到对应cookie信息;如无,则通过流程6.1种cookie)等信息,以及自定义事件(如注册等)数据。

流程5:传输收集的信息给后端脚本。

流程6:流程6.1后端脚本生成透明1*1像素图片,在浏览器中种入cookie标识访客。流程6.2后端脚本解析并发送流程5得到的信息,并从网站Web Server获取IP、访问时间等信息,写入日志Log队列。

流程7:日志信息发送至实时统计服务。实时统计后数据入库至实时数据库。

流程8:离线统计服务从实时数据库调用数据进行离线分析,并入库至离线数据库。

流程9:查询数据库,并进行可视化数据报表呈现。

浏览器指纹

用户使用浏览器浏览网站时,该用户浏览器相关的数据和操作称为指纹,如userAgent(包含浏览器版本号等信息)、http_accept(http协议头中的一个字段)、plugins(浏览器安装的插件信息)、timezone(时区信息)、fonts(系统安装字体)等。这些指纹信息都与用户的个人习惯、使用环境有关,综合用户其它信息(如IP地址等)时,可以有效辨别用户特征,因此称为浏览器指纹。进行反作弊工作时,经常需要用到这些指纹信息。

THE END
分享
二维码
< <上一篇
下一篇>>