自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小白兔de窝

心平气和,不起执念。

  • 博客(734)
  • 论坛 (6)
  • 收藏
  • 关注

原创 【Python】常见数据处理代码

计时 import timeT0 = time.time()T1 = time.time()print("Run time %s min, %s h" % ((T1 - T0) / 60, (T1 - T0) / 3600)) 实时日志打印 定义一个类:class Logger(object): def __init__(self, log_path="default.log"): import sys self.terminal = ..

2021-04-03 19:28:03 54

原创 【WPS】常见WPS数据处理技巧

WPS表格按相同内容出现数量多少进行降序排序? 比如第一列有五百个地名,想按照出现相同地名次数的多少从大到小排序,比如济南(59),青岛(49),烟台(39)解决:假如你有100行数据,增加一个辅助列比如F列,在F2输入公式=COUNTIF(A$2:A$101,A2),公式下拉自动填充到表未尾,再把整个表格按F列进行降序排列就可以了。WPS表格按列填充公式在首行输入公式,再选中填充区域,列填充快捷键是CTRL+D ;行填充快捷键是CTRL+R...

2021-04-03 18:00:32 109

原创 【Linux】常见Linux shell数据处理命令

Linux sort 按多列去重复 文件按逗号分隔,根据第一列、第二列去重复:awk -F',' '!i[$1$2]++' all_data.csv >> all_data.csv文件按单行去重复,只打印指定列:cat all_data.csv | sort | uniq -c | awk '{print $2}' >> all_data_uniq.csv ...

2021-04-03 16:49:51 59

原创 【论文写作】英文错误集锦

【语法错误】检查全文的et al—— et al 后面有个点。检查全文的as—— as后面是跟从句,不能只跟一个名词:as the sacrifice of most peaks(X)【搭配不当】形容solution space 一般用complicated而不是hard:the hard solution space(X)新的、讨巧的说法,不一定严密。先保证不出错,再斟酌词句。在deadline之前提前半周-一周把事情做完。...

2020-11-02 21:18:50 143

原创 【收藏夹2020-2021】

《千与千寻》背后暗藏的寓意你真的明白吗?在一个无国界( borderless)的时代,无立足之地的人是最受人鄙视的。立足之地就是过去,就是历史。 在我看来,没有历史的人和忘记了过去的民族,只能如蜉蝣一般消失,或者像一只鸡一样只知埋头生蛋,直到自己被吃掉。《 异境中的千寻——这部电影的主旨》—— 宫崎骏 1999年11月6日“曾经发生的事情不可能忘记,只是想不起来而已”,这是钱婆婆对千寻说的话。https://www.sohu.com/a/321946610_100205824...

2020-09-16 21:35:53 251

原创 【技术】Windows连接Linux主机,解决MobaXterm不时地自我断开的问题

问题出在MobaXterm自身的设置里,打开Settings-> Configuration ->SSH,勾选SSH keepalive

2021-06-01 18:02:44 19

原创 【Python】ReportLab生成pdf

如何表示空格:用‘\0‘来表示空格reportlab实现横线style:

2021-05-31 16:36:08 16

转载 【数据处理】正则匹配指定字符传后面的字符

方法1: 匹配,捕获(存储)正则表达式:(?<=(href=")).{1,200}(?=(">)) 解释:(?<=(href=")) 表示匹配以(href=")开头的字符串,并且捕获(存储)到分组中 (?=(">))表示匹配以(">)结尾的字符串,并且捕获(存储)到分组中...

2021-05-29 20:44:58 24

原创 【数据处理】正则表达式中的括号

1. 小括号() 是为了提取匹配的字符串。表达式中有几个()就有几个相应的匹配字符串。(abc)?,表示这一组要么一起出现,要么不出现,出现则按此组内的顺序出现

2021-05-29 19:40:30 15

转载 【数据挖掘】http请求头中Referer的含义和作用

Referer是HTTP请求header的一部分,当浏览器(或者模拟浏览器行为)向web服务器发送请求的时候,头信息里有包含Referer。比如我在www.google.com里有一个www.baidu.com链接,那么点击这个www.baidu.com,它的header信息里就有:Referer=http://www.google.com由此可以看出来吧。它就是表示一个来源。看下图的一个请求的Referer信息。这里有一个小问题要说明下。Re...

2021-05-22 11:31:34 47

原创 【Linux】复杂的sort -k 按列排序命令,有坑!!

原理 【案例1】要求按第1列的第二、三个字符,按数字、逆序排序sort -k 1.2, 1.3nr这个语法格式可以被其中的逗号(“,”)分为两大部分,Start部分和End部分。先给你灌输一个思想,那就是“如果不设定End部分,那么就认为End被设定为行尾”。这个概念很重要。前后两部分的点号(“. ”)用来分割指定列、指定字符-k选项的具体语法格式,如下:[ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ ..

2021-05-14 21:04:12 30

原创 【数据挖掘】采集人员信息的技巧

1. 找个企业或机构,点开人员列表页,用后羿采集器批量采集全部人员数据。有时候不同详情页格式不一样,建议只用一个字段,存放全部内容。2. 将导出的xlsx转化为csv3. 用notepad++打开csv,开始批量替换,例如(1)英文逗号 正则替换为 中文逗号(2)\r\n 正则替换为 \r\r(3)\n ...

2021-04-21 16:58:06 43

原创 【数据处理】Notepad++正则替换,替换内容的正则表达式怎么写

案例说明原始数据为csv文件小明 点击: 6508 次 男想要的效果:小明, 点击: 6508 次,男解决步骤:第一步,用正则表达式识别出 “ 点击: 6508 次 "。打开notepad++,打开【搜索】->【替换】,勾选【正则表达式】,然后在【查找目标】输入:(\s*)点击:(\s*)(\d+)(\s*)次(\s*)第二步:正则替换为 “,点击: 6508...

2021-04-21 14:02:29 56

转载 【转载】双重身份:2017JCR既是SCI又是SSCI的期刊名单

转自:http://blog.sciencenet.cn/blog-651374-1061883.html2017发布-JCR-IF已经悄然过去了一个星期,如果对于标题的内容仍然感兴趣的话,不妨驻足一探,您感兴趣的期刊是否在列?博文Scopus和JCR的比较:2017最新发布期刊影响因子数据浅析说明了期刊总排名会出现肿大,并提出了可能的原因。本文直接奉上那些在20170614发布的JCR总排名中占据两个位置——既是SCI又是SSCI 的633种期刊名单,如下。Serials No. ..

2021-04-19 07:51:36 74

原创 【可视化】使用PS将图片从白底换成其他底色时,如何保留头发边缘的发丝

【知识点】借助剪切图层蒙版,可以在不擦除头发形状的同时,去掉白边。剪切图层蒙版的原理是”下形状,上颜色“,使用处于下方图层的形状来限制上方图层的显示状态,达到一种剪贴画的效果。------------------------------------------------------------------------------------------------第一步:打开图片,在原图基础上新建 一个透明图层;第二步:点击透明图层,按Ctrl+Alt+G,或者点选【图层】-&gt

2021-04-10 23:01:02 108

转载 【Linux】在Windows 10环境下安装适用于 Linux 的子系统 (WSL安装指南)

安装适用于 Linux 的 Windows 子系统 (WSL) 时有两个选项: 简化安装(预览版):wsl --install 要使用wsl --install简化安装命令,你需要加入Windows 预览体验计划并安装 Windows 10 的预览版(OS 版本 20262 或更高版本),但不需要执行手动安装步骤。只需使用管理员权限打开命令窗口并运行wsl --install,重启后即可使用 WSL。 手动安装:按照下列 6 个步骤进行操作。 下面列出了 WSL 的...

2021-04-04 15:33:59 239

原创 【技术】Word文档毕业论文技巧:如何编辑页眉和页脚

1.怎样在Word页眉中添加章节标题?(1)确保你的文章有标题索引(2)选择【插入】->【页眉和页脚】,或者双击页眉区域。(3)点击“插入”—“文档部件”—“域”。(4)插入标题名:在打开的窗口中,选择StyleRef,在“样式名”中选择“标题1”,点击“确定”,可插入章节标题。(5)把光标放在标题前,按照步骤(4)重新进入StyleRef-标题1,勾选【域选项】里的”插入段落编号“,可插入章节编号。参考:https://jingyan.baidu.com/a.

2021-03-24 17:46:41 264

原创 【Python】关于Caused by SSLError Max retries exceeded with url 的错误

可能的问题和解决方法如下:1.http连接太多没有关闭导致的解决方法1:关闭多余链接import requestsrequests.adapters.DEFAULT_RETRIES = 5 # 增加重连次数s = requests.session()s.keep_alive = False # 关闭多余连接s.get(url) # 你需要的网址解决办法2:增加重连次数requests.adapters.DEFAULT_RETRIES = 52.访问次数频繁,被禁..

2021-03-17 23:07:04 529

转载 【技术】python 爬虫一招解决SSl 报错SSLError

摘要用python写爬虫的时候没我们经常遇到https认证的网站,采用常用模块requests模块,我们一般在请求中将verify设置成假,免证书验证,但是这些都是理想状态,https请求很容易报错,一旦报错就难以解决。举个列子编写一个简单的列子,我们的目标对象是一个https的网站,它的编码是gb2312,按照常用手法,我们设置免验证的方法,按照我们正常的逻辑,肯定是能成功,但是这里却不符合逻辑简单爬虫案例下面开始运行代码:异常报错报错的信息,无非是ssl的各种报错,我这里是

2021-03-17 22:22:30 220

原创 税务相关

税控驱动下载:https://inv-veri.chinatax.gov.cn/xgxz.html增值税发票综合服务平台网址:https://fpdk.guangdong.chinatax.gov.cn税务UKEY抄报和清盘怎样操作?1、插入税务du磁盘,打开增值税发票税控软件,单击“登录”。2. 开票软件左边导航栏点击“数据管理”—> “数据处理”—> “汇总上传”。3、一般纳税人在征期内可在如下界面点击“上报汇总”按钮。3. 上报汇总完成后企业可在电子税务局进行纳税申报。

2021-03-17 09:45:03 48

原创 《穿越迷雾》

一清晨,早起,一个蛋,一瓶牛奶、俩小蛋糕,摆桌上夜晚,回家,两个人,出门散步、超市购物,牵手上睡前,取三个盅放米、杂粮、汤料,添净水定时隔水炖,是次日的主食备两样食材,配荤素各半,切辅料装盘塑封存冰箱,是次日的主菜连续多日,我问你,累吗?你说,不累,自愿并放松着二散步时,二人起了争执你希望母亲前来,照顾孕妻生活起居我希望延续当下,保持小家自在轻松几番来回,你生气如刺猬,到处扎人日常累积的不满,统统成了你的刺不准点吃饭喝汤,忘记吃钙片,点冷饮,熬夜三卧室门开着,灯亮着你

2021-02-27 11:56:55 158 4

原创 【记录】毕业大论文要写多久

准备工作——5.5h找模板、整格式,2h写目录大纲,1.5h机械翻译小论文并汇总,2h中英文摘要、最后一章(总结、创新点、展望)——3.6h第一章绪论——4.6h。第二章——2.5h第三章——2.5h...

2021-02-05 11:53:02 366

原创 【记录】年底了,上班有感

我申请了在小明旁边的位置临时坐几天,把毕业论文写写。有一些观察和启发。1. 为什么办公室比咖啡馆好每天跟着小明去工位上,紧紧张张一上午,放松愉快一下午,晚饭后再坐一个小时,每天五六个小时,能干一周的活。上班就是这种自然而然、高效率的状态,无需刻意努力和自律。原因有四个(环境、监督、社交、事情):一是环境明亮、设备齐全。相比家里而言,所有需要的东西都在手边,不被任何其他物品分心。相比咖啡馆而言,卫生间、喝水都不用跑很远,设备放着也很安心;二是有人监督。众目睽睽之下,就不好意思干别的。有时候累了玩

2021-02-05 11:18:58 277 2

翻译 【学术】观点动力学模型——IJAC主题分享会议上的听讲笔记

听完了一场分享,下面记录一下重要内容。PS:作者PPT的背景图信息丰富,作者习惯用黄色方框框出重要结论。第一部分 私有观点和表达观点的区别第二部分:个体社会能量的演化其中第二篇论文发表于IEEE Transaction on Automatic Control,Evolution of social power in social networks with dynamic topology,2018年。第三部分:多个相关观点这篇论文发表于ITAC2020,Co

2021-02-04 15:35:05 164

原创 【技术】word2016下划线只显示一半,如何显示末尾空格的下划线

打开word2016,依次点击【文件】->【选项】->【高级】找到“以下对象的布局选项”,选择“为所有新文档”,勾选“为尾部空格添加下划线”,完成!

2021-01-28 17:53:01 483

原创 【菜谱】口感好的快手菜

做饭小白,喜欢成品,不喜欢过程。发现几个超级快手菜,口感不错。1. 凉拌黄豆芽根据王刚老师的教程,豆芽的关键在于保持脆感。所以下水焯至断生,撒两勺盐,水开两秒即可捞出。因为凉水不卫生,所以放在铁盆里自然放凉。重点来了:蒜末、生抽、辣椒、白糖在一个碗里。热油浇上去,蘸料就好了。前面放盐煮了,这里就不用放了。之所以口味和我之前的菜不一样,可能是因为加了白糖,白糖遇热油起了化学反应,提鲜。把蘸料倒入豆芽中凉拌,盛出来放到草帽盘中,盘子多余的白边衬托出食物的美感,超级好看。草帽盘.

2021-01-25 22:38:21 92

原创 【经验】交付代码注意事项

手动设置的部分,一律用input()函数不要用写入代码的形式!即使当时客户知道了,后续面对密密麻麻的代码,也无从改起。注意提醒用户,用英文逗号作为分隔符。用readlines()读取文件,必须处理多余的空行第一是要用 if语句 判断空行,客户很容易在文件末尾输入很多空行。第二是不能直接在原来的列表做修改,要新建一个列表,一个一个append。with open(file, "r", encoding="utf-8") as fd: lis = fd.readlines() ne

2021-01-24 00:05:36 233

原创 【经验】面对感冒引起的发烧怎么办,总结一些有用的经验

天一降温,小灰就发烧了。连续两天高烧。幸运的是,经过两天的连续休息和调理,第三天已经基本好了。先说失败经验。第一天上午他就积极地去医院,结果顶着高烧,做了一上午的核酸检测、肺部CT,还要冒着在发热门诊久呆的的风险。医生非要拿到核算和CT结果才给看病,这是程序问题,可就是苦了病人。中午十二点,终于开了退烧药回家了。如果知道这个结果,一开始就在药房下单,还能在家休息好点。成功经验是小灰不停地监控自己的体温,退烧药吃得合理。退了两次烧,这中间我们也积极地做了很多功课。感冒发烧的一些知识有人提到,感

2020-12-12 11:02:03 181

转载 【复杂网络】社团划分结果评估指标:Q、ARI、NMI

社团划分结果评估指标:Q、ARI、NMI一、模块度Q(Modularity)模块度也称模块化度量值,是目前常用的一种衡量网络社区结构强度的方法,最早由Mark NewMan提出了。模块度的定义为:模块度值的大小主要取决于网络中结点的社区分配C,即网络的社区划分情况,可以用来定量的衡量网络社区划分质量,其值越接近1,表示网络划分出的社区结构的强度越强,也就是划分质量越好。因此可以通过最大化模块度Q来获得最优的网络社区划分。Python:可以直接使用Community.modularity(

2020-11-29 12:12:55 1214

原创 【Python】Python中的图的邻接矩阵转化为字典格式

networkx,adjacency_matrix()函数print(A) 是按节点对的形式显示,数据类型为<class 'scipy.sparse.csr.csr_matrix'>print(A.todense()) 按矩阵形式显示,数据类型为array现在需要将邻接矩阵转化为字典格式,用:nx.to_dict_of_dicts(G)输出:{0: {1: {'weight': 1}}, 1: {0: {'weight': 1}}}...

2020-11-10 12:15:49 543

转载 【Matlab】导入python生成的网络邻接矩阵

------------------在python中导出矩阵至matlab------------------------------一、通过文本文件如果矩阵是mxn维的。 那么可以用 :np.savetxt('dev_ivector.csv', dev_ivector, delimiter = ',')对应matlab读取为:dev_ivec = csvread('dev_ivector.csv') ###csv格式其实就内定了结构体如果矩阵是(n,)这种格式。['aa...

2020-11-10 11:49:31 440

转载 【MATLAB】 Graph Object(3): 展示关系网

老板:myc你还想不想转正了??myc:我只是去过五一长假了而已……老板:骗鬼呢?五一早就不放7天了好吗,App Designer都快写完了,你不想转正人家就要上位了myc:人家已经是老员工了……老板:再不写就开除myc:……myc这就把他呕心沥血的难产产物献给大家……我们在上一篇讲Graph的文章中生成了一个专栏462名关注者的关系图。然而有句古话说的好Code is cheap, show me the plot.好在MATLAB新的Graph类自带了plot的函数.

2020-11-10 10:55:04 356 1

转载 【Matlab】评估网络节点重要性

centrality衡量节点的重要性全页折叠语法C = centrality(G,type)C = centrality(___,Name,Value)说明示例C= centrality(G,type)为图中的每个节点计算由type指定的节点中心性。示例C= centrality(___,Name,Value)使用一个或多个名称-值对组参数指定的其他选项。例如,centrality(G,'closeness','Cost',c)指定遍历每条边的成本。...

2020-11-10 10:07:48 936

原创 【算法】可完整运行的ACO蚁群算法(Matlab)

可运行的蚁群代码:clearclcAnt = 300;%蚂蚁数量Times = 80;%移动次数Rou = 0.9;%荷尔蒙发挥系数P0 = 0.2;%转移概率Lower_1 = -1;%搜索范围Upper_1 = 1;Lower_2 = -1;Upper_2 = 1;% 以下为自定义X = zeros(Ant,2);Tau = ones(1,Ant);Tau_Best = zeros(1,Times);P = zeros(Times,Ant);for i=1:Ant

2020-11-02 16:57:53 243

原创 【Matlab】Matlab入门笔记

从python转向matlab,记几个不一样的地方。数据类型整型有int8、int16、int32等;默认类型是双精度浮点型。Inf、-Inf表示正负无穷。NaN表示非数值。取整函数floor向下取整、ceil向上取整。round()向最近的数字取整,数字为0.5则取绝对值大的方向。加减乘除双精度浮点数参与运算时,返回值类型取决于其他参与数据类型。其他为逻辑、字符型,返回双精度;其它为整型,返回整型;其他为单精度,返回单精度。注意单精度浮点不能和整型进行算熟运算。关系运算

2020-10-30 21:40:49 246

原创 【鉴别】为什么维基百科比百度百科好用,谷歌学术比百度学术好用

(1)wiki百科会详细列出某个概念的来源、最早的文献及贡献者。相比之下,百度百科随机引用文献,对里程碑式的工作无引用。举例来说,在【wikipedia】搜索关键词"Genetic programming",得到如下结果:它介绍到,这个概念最早被John Holland提出、代表性著作是XXX,后续发展的大多数作者都是Holland的学生,以及它们又做了哪些贡献。简直就是一部详尽的学科方向发展史。以及让人看到前人的垦荒和后人继承的详细过程,对当下科学研究仍有启发。相比之下,【百度百科】.

2020-10-25 11:56:08 358

转载 【学习方法】有一个成绩很好的哥哥是什么体验?

Part 1 成为出题者我哥第一次认真的教我。不同于以前的敷衍,他帮我从书上画出重点,自己出题目给我做,他要求我反复的去做他画的重点题目,不停的做,反复的做,全神贯注的去体会,让大脑自己去熟悉这个解题过程,而不是单纯的去记忆解题方法,更不是记住答案,必须要用自己的思维去感受,去揣摩一步步解开这个逻辑命题的步骤,体会这种感觉,并牢牢记住这种感觉。然后以此为基础,自己想出在同样的条件下,出题者可能会以何种方式来考察你的逻辑推理步骤,这样一来,一道题就可以变幻出至少十道题,三道题的结合就可以变幻出五十道,正.

2020-10-19 13:33:54 199 3

原创 【科研】基于Aminer的各领域文献统计

【上升领域】特点:上升曲线,或者突然爆发的支柱,多以2020-2023结尾。fake news (up)deep learning (up)community detection (up)machine learning (up)graph neural network (up)【下沉领域】特点:连续三条柱体呈现下降趋势,多以2017-2020结尾。complex network (down)data mining (d...

2020-10-16 16:58:30 144

原创 【论文写作】英文论文句子的流水记录

解决迁移问题:addressing the effects of migration in parallel evolutionary algorithms.排除简单并联:Finally, from a technological perspective, we also do not consider distributed optimization that makes use of geographically dispersed computers and allows using gri...

2020-10-12 23:29:39 192

翻译 【学术】计算传播学:自然语言处理技术的应用情况和前景

社会传播学的研究方法可为实证和阐释两大类别:实证性方法假设事实真相是确定且唯一的,可通过量化分析或测试推导出因果关系。阐释性方法则立足于多重事实与真相的假设,侧重于研究语言、文本等交互信息自身的意义和价值。想象阐释性和实证性方法分别处于地球的两极,七大流派就填充于两极之间的空白地带,分别为:社会心理学派、控制论学派、修辞学派、符号学派、社会文化学派、批判学派、现象学派。排序越靠前的流派,越多地采用实证性研究方法,反之则表示阐释性研究方法在该理论中占上风。倾向实证性的学派与NLP的联系更加紧.

2020-10-09 22:06:49 374

空空如也

求教python高手:一个简单的问题,lstrip函数切割错误

发表于 2015-08-08 最后回复 2020-04-16

python 如何定义动态二维数组

发表于 2015-08-17 最后回复 2020-01-13

python-matplotlib画图:如何将一个数以【指数形式】展现出来

发表于 2015-12-03 最后回复 2019-03-18

CSDN将我的一篇置顶博文搞丢了

发表于 2017-10-17 最后回复 2018-09-03

博客栏目中的类别名,希望允许冒号、竖杠、中文括号的存在

发表于 2017-12-13 最后回复 2017-12-13

vector定义二维数组之后,在子容器添加元素的方法——即扩充列元素。

发表于 2016-03-16 最后回复 2016-03-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除