这篇博客只是为了自己记录方便,在之前的一篇博客中,我介绍了如何下载安装GitHub完整记录数据库GHTorrent的方法。这几天由于实验的需要,准备重新走一遍流程,发现了标题中所说的问题,所以简单记录一下。
在导入Projects.csv这个表的时候,报:
Incorrect datetime value: '1970-01-01 01:00:01' for column 'updated_at' at row 1
我实在不知道这为什么会报错,但是也没时间仔细分析,最简单的办法就是删除第一行,不过对应的表projects.csv特别大,不能用gedit,sublime text之类的软件打开。通过尝试,可以通过vim打开并编辑,所以尝试一下:
在文件上右键——打开方式——Vim,由于文件有15.5GB,载入内存的时候需要一些时间。打开之后,由于我们只需要删掉第一行,而目前光标就处在第一行,所以连按DD就可以删掉该行,具体可参考:https://zhidao.baidu.com/question/161443045.html
删除之后需要保存退出,那么只需要依次输入:
:wq
就可以保存更改并退出vim了。Vim的具体操作可以参考这些链接:
https://www.cnblogs.com/chenlogin/p/6245958.html
https://blog.csdn.net/feosun/article/details/73196299
就简单记录这么多。