Python爬虫中的万能过滤规则
经过初次爬虫得到的文本,里面很可能包含了大量的font、span等标签,用以下过滤规则可以很方便的对其进行过滤。 [crayon-6854e486c0d98470176782/] 使用的时候也很简单,只需要: [crayon-6854e48...
经过初次爬虫得到的文本,里面很可能包含了大量的font、span等标签,用以下过滤规则可以很方便的对其进行过滤。 [crayon-6854e486c0d98470176782/] 使用的时候也很简单,只需要: [crayon-6854e48...
这几天看论文,看到了一个评价指标:AUC。之前面对的都是mAP,或者TP/FP这种,对AUC没有太深的了解,就趁这个机会巩固一下关于AUC的相关内容。首先来看一张图: 这个就是大名鼎鼎的ROC曲线,而AUC就是这个曲线与X轴的面积。首先结论...
最近被.DS_Store文件烦死了,这个文件是自动生成的,基本上每个文件夹下都会有。主要是记录了当前目录下文件的排列、缩略图设置等。 不过在Python下批量操作文件的时候,老是把它也加进去,导致报错。索性全删掉!命令如下: find "/...
推荐当简单方法不能用的时候,再使用复杂方法。我这边实测GitHub clone的速度能到2M/s 简单方法: 打开本地的hosts,然后填入: [crayon-6854e486c126b729974044/] OK! 复杂点的方法: 打开这...
最近百度云的海外网盘Dubox来了,号称是不限速网盘,我这边测试了下,上传速度能到10M/s,下载速度也能达到3.3M/s。 有兴趣的可以试试:https://www.dubox.com/ 不过很遗憾的是,国内无法使用,如果检测到国内IP,...
之前有两篇关于Ubuntu下安装vnc进行远程连接文章。 不过有的同学可能弄混了,那两篇是在容器lxd下进行安装的,而不是宿主机,其实宿主机下使用VNC进行远程连接更加方便。因为我们默认安装的系统桌面就是Gnome,所以我们只需要利用系统自...
现在开机自动运行了一些脚本,但是运行完之后终端并没有关闭,想改成脚本运行结束之后就自动关闭窗口。 方法如下: 终端-偏好设置-描述文件-shell-当 shell 退出时。改下面为关闭窗口就可以了。 本文最后更新于2020年9月8日,已超过...
最近遇到很奇怪的事情,Mac端的隔空投送时灵时不灵的,有时候Mac端可以发现IPhone和Ipad,而这两个发现不了Mac,有时候又相反,IPhone和Ipad可以发现Mac,而Mac死活都找不到那两个。经过我多次实验,终于发现了原因。 主...
Mac默认只有Python2,但是没有pip2,下面说一下比较简单的安装方法,几条命令即可。 curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py python2 get-pip.p...
官网上的教程太旧了(2020年09月04日19:38:23),还是4.0的。有几个命令有错误,在这里写个修改版的备份一下: 安装要求: 内存: 512M以上,推荐768M以上(纯面板约占系统60M内存) 硬盘: 100M以上可用硬盘空间(纯...