Tag: etl

使用用户提供的脚本parsing文本文件的安全方法

我正在寻找一种方法来parsing用户提供的URL的文本,用户也提供了parsing器脚本。 eval很容易,但显然超级可怕。 最终目标是只允许用户指向我的服务器的数据源,并告诉我的服务器如何读取数据。 什么是最安全的方法来做到这一点? python或节点首选,但我不限于任何特定的语言。 所以例如。 这是一个cvs文件,但有时我只会有一个文本文件。 url: http : //www.ams.usda.gov/mnreports/lm_xb803.txt 这个python脚本可以从url读取文件,并存储在数据库中: expected_length = 6 requiredFeilds = ['low','high'] requiredNonZero = ['low','high'] response = urllib2.urlopen(url) reader = csv.reader(response) grade = None date = None first_row = True keep_list = [] for row in reader: if len(row) != expected_length: continue if first_row: date_text = row[2] date_object = […]