1. 首页
  2. Python

这个python工具能够轻松地分析你的上网记录,建议马上收藏起来

“u003Cdivu003Eu003Cpu003E长时间使用浏览器会积累大量浏览器历史记录,这些是很隐私的数据,里面甚至可能有一些不可描述的网站或者搜索记录不想让别人知道。u003Cu002Fpu003Eu003Cpu003E不过,我们自己可能会感兴趣,天天上网是都在摸鱼还是有认真工作。其次,了解下自己每天打开多少次网页、哪些网站上的最多、常搜哪些关键词,这些也很有趣。u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F06e2b9ffc9c84a739da433260bd4a8e6″ img_width=”1024″ img_height=”724″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E下面就来给大家介绍一款 Python 编写的神工具,可以一键分析你的上网行为。我用了后发现了很多不可思议的结论。u003Cu002Fpu003Eu003Cpu003E比如访问次数最多的网站居然是微信公众号,7000 多次,看来弄自媒体占了大量上网时间。u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002F5ef67880a9174b35b75e4e1d8c49e296″ img_width=”720″ img_height=”341″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E看到了每天打开网站的次数,平均都有好几百次,8 月 8 号那天发生了什么,竟打开了 1600 多次!u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp9.pstatp.comu002Flargeu002Fpgc-imageu002Faac63fdb52a145e295211d7290396b16″ img_width=”720″ img_height=”341″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E然后又统计了停留时间最长的网页页面,在 http:u002Fu002Fmd.aclickall.comu002F 这个网站居然停留了 660 小时,这是个文章排版网站,因为经常要排版所以把该页面固定了起来。u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002Ff402503968fb49c18c6dfc30ff878227″ img_width=”720″ img_height=”247″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E然后统计出了搜索最多的十个关键词,Python 居然是第一位!前十中基本都是数据编程相关的,没想到自己这么爱学习。u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002Fbed7653d42e4463784e7496d46b17756″ img_width=”720″ img_height=”341″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E最后统计出了各大搜索引擎的使用率。Google 的使用率达到了 97.3%,而百度只有不到 3%,大概是偶尔无法科学上网的时候用了下百度。u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002F5bccb3dbc3d44c22b2567b4eb4f81dbe” img_width=”720″ img_height=”306″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E怎么样是不是挺有意思?下面就来说说怎么用这款工具,让你也可以分分钟了解自己的上网行为,非常简单。u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F75ad4f2ed21d49a3b5887d1c70298db0″ img_width=”400″ img_height=”228″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E这款 Python 工具其实就是分析浏览器的历史记录数据库文件然后可视化。这里的浏览器只支持 Chrome 和以 Chrome 为内核的浏览器,比如 Centbrower 、360极速浏览器等,其他浏览器比如 ie、Firefox 不支持。如果有登陆账号,桌面端和电脑端会一起分析,更全面。u003Cu002Fpu003Eu003Cpu003E第一步,打开网址:(在下方得到)u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F4111a497a0d04127b4d82ef0c219088c” img_width=”720″ img_height=”352″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E接着上传你的浏览器历史记录文件,这个历史记录文件怎么获得呢?u003Cu002Fpu003Eu003Cpu003E新建一个标签页,输入 chrome:u002Fu002Fversionu002F 回车,可以打开你的浏览器详细信息:u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002Fec276a1dd0f24670b9a842bb1918859e” img_width=”720″ img_height=”262″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E复制「个人资料路径」到资源管理器打开,然后找到 history 文件复制一份到桌面。u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002Fc15cb7fd16364ed59cfdef961bdc890c” img_width=”720″ img_height=”481″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E接着就在刚才的网站中上传该文件(我的文件有 15MB 大),稍等片刻就可以得到上门的那些可视化分析结果。u003Cu002Fpu003Eu003Cpu003E你可能会担心上传浏览器历史记录是否安全,尽管放心,这个程序是开源的。u003Cu002Fpu003Eu003Cpu003E下面再简单说下如何用 python 一步步实现的这个程序功能的,这是一个很棒的 python 练手项目,涉及到了前后端的知识,整个程序包含多个文件:u003Cu002Fpu003Eu003Cpreu003ECodeu003Cbru003E├─ app_callback.py 回调函数,实现后台功能u003Cbru003E├─ app_configuration.py web服务器配置u003Cbru003E├─ app_layout.py web前端页面配置u003Cbru003E├─ app_plot.py web图表绘制u003Cbru003E├─ app.py web服务器的启动u003Cbru003E├─ assets web所需的一些静态资源文件u003Cbru003E│ ├─ css web前端元素布局文件u003Cbru003E│ │ ├─ custum-styles_phyloapp.cssu003Cbru003E│ │ └─ stylesheet.cssu003Cbru003E│ ├─ image web前端logo图标u003Cbru003E│ │ ├─ GitHub-Mark-Light.pngu003Cbru003E│ └─ static web前端帮助页面u003Cbru003E│ │ ├─ help.htmlu003Cbru003E│ │ └─ help.mdu003Cbru003E├─ history_data.py 解析chrome历史记录文件u003Cbru003E└─ requirement.txt 程序所需依赖库u003Cbru003Eu003Cu002Fpreu003Eu003Cpu003E每个程序实现的功能:u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002Ff909d79ff51c4d0f82844b51c102785c” img_width=”720″ img_height=”282″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E具体实现思路大致分为下面几点:u003Cu002Fpu003Eu003Culu003Eu003Cliu003E解析历史记录文件数据u003Cu002Fliu003Eu003Cu002Fulu003Eu003Cpu003E历史记录 history 是一个 sqllite 数据库文件,连接数据库查询然后调用数据库中的信息并存储。u003Cu002Fpu003Eu003Culu003Eu003Cliu003E配置 web 服务器和前端页面可视化绘图函数u003Cu002Fliu003Eu003Cu002Fulu003Eu003Cpu003E可视化图形使用的是可交互式的 plotly 库。u003Cu002Fpu003Eu003Cpu003Eu003Cstrongu003E小结u003Cu002Fstrongu003Eu003Cu002Fpu003Eu003Cpu003E上网记录是很重要的隐私数据,平常自己可能无法从中直接发现什么,使用 python 简单一分析就可以发现很多东西,所以平时尽量注重隐私保护。u003Cu002Fpu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fdfic-imagehandleru002F90e80a11-86b8-4c30-8dd8-bcb92deb1e66″ img_width=”1023″ img_height=”682″ alt=”这个python工具能够轻松地分析你的上网记录,建议马上收藏起来” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E最后多说一句,小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以关注小编,并在后台私信小编:“01”即可领取。u003Cu002Fpu003Eu003Cu002Fdivu003E”

原文始发于:这个python工具能够轻松地分析你的上网记录,建议马上收藏起来

主题测试文章,只做测试使用。发布者:逗乐男神i,转转请注明出处:http://www.cxybcw.com/12908.html

联系我们

13687733322

在线咨询:点击这里给我发消息

邮件:1877088071@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code