参考文章:Normalize URL path python
首先说下什么叫URL拼接,我们有这么一个HTML片段:
<a href="../../a.html">click me</a>
做为一只辛苦的爬虫,我们要跟踪到这个click me指向的页面,假设这个片段来自:http://www.xxxdu.com,那么目标页面是什么呢?
显然不是
http://www.xxxdu.com/../../a.html
而是
http://www.xxxdu[......]
参考文章:Normalize URL path python
首先说下什么叫URL拼接,我们有这么一个HTML片段:
<a href="../../a.html">click me</a>
做为一只辛苦的爬虫,我们要跟踪到这个click me指向的页面,假设这个片段来自:http://www.xxxdu.com,那么目标页面是什么呢?
显然不是
http://www.xxxdu.com/../../a.html
而是
http://www.xxxdu[......]
今天下午将Thrift定义的格式生成Java,折腾了3个小时,在依赖包齐全的前提下,死活出一堆编译错误。
最后开始翻代码,终于发现了原因:index是Java接口内部保留字,请不要用它做任何函数名、结构体、变量名……[......]
一行就能搞定,输出32或者64
$ getconf LONG_BIT
$ 64
用在Makefile里非常给力……
OS = $(shell getconf LONG_BIT)[......]
当前使用web8源的方式已经失效了,还是需要手动解压缩安装。
1 下载
https://www.oracle.com/hk/java/technologies/javase/javase8-archive-downloads.html
下载 jdk-8u202-linux-x64.tar.gz
2 解压缩
sudo mkdir /usr/java
sudo tar -xf ./jdk-8u202-linux-x64.tar.gz -C /usr/java
3 修改环境变量[......]
#Check fcitx ppa source at https://launchpad.net/~fcitx-team
sudo add-apt-repository ppa:fcitx-team/stable
sudo apt-get update
sudo apt-get install fcitx[......]