我有大约500万条记录的数据集。日期以字符串形式读入。它们的格式为MM / DD / YYYY HH:MM:SS。我只对日期部分感兴趣,因此我以(A10)格式阅读它们,有效地节省了时间。
然后我做ALTER TYPE DateVar (SDATE10)
。我这样做是因为我认为排序日期会更快,但是我找不到对此的确认。
有没有办法计时SPSS命令来解决类似的问题?
我能想到的最快方法是使用python作为时间戳,并使用常规的SPSS语法进行排序-只是复制真实条件
***Start timer, in python.
begin program.
import time
start = time.time()
end program.
***go out of python, into normal SPSS syntax, and do your stuff.
/*Put the syntax you want to test here
***get back to python, stop timer, and calculate time difference.
begin program.
end = time.time()
print("It took ",end - start, " seconds")
end program.
检查输出日志,它将显示您的时间。
不是很科学,但是又快速又容易。我建议在测试之间重新启动SPSS-只是为了确保一项测试不会影响另一项。
从我的经验来看,alter type
有些事情会影响代码执行时间。不知道是什么,但是经过,一切似乎都变慢了alter type
。因此,您还可以考虑使用后保存并重新打开alter type
。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句