Neel
个人专栏

最新文章

Ubuntu搭建Squid代理服务器以及配置SSL

ubuntu的apt-get编译好的squid是没有包含ssl,需要手动编译。编译安装安装ssl相关的包apt-get install openssl libssl-dev ssl-cert下载squid源码apt-get source squidapt-get build-dep squidapt-get install devscripts build-essential fakeroot修改

Spark DataFrame join后移除重复的列

在Spark,两个DataFrame做join操作后,会出现重复的列。有两种方法可以用来移除重复的列。方法一:join表达式使用字符串数组(用于join的列)df1.join(df2, Seq("id","name"),"left") 这里DataFrame df1和df2使用了id和name两列来做join,返回的结