如何使用 Python 从法兰克福证券交易所下载 Blob 数据?
使用 python 从法兰克福证券交易所下载 blob 数据
在本问题中,一位用户希望使用 python 从法兰克福证券交易所的主数据文件 下载链接 下载 excel 文件。然而,使用 urlib 和 wget 检索时,结果是一个指向 blob 的 url,下载的文件只有 289 字节且不可读。
用户面临以下疑问:
- 是否可以使用 python 成功检索 blob 后面的文件?
- 如果可以,是否有必要揭开 blob 背后的“真实”url,以及如何揭开?
对于第一个问题,答案是肯定的。解决这个问题的关键是指定用户代理。如果不指定用户代理,服务器会返回一个 403 forbidden 页面,这就是用户只收到 289 字节 html 代码的原因。
可以通过在 python 脚本中使用以下代码指定用户代理:
# 使用 Safari 的伪造用户代理 fake_useragent = 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'
关于第二个问题,揭开 blob 背后的“真实”url 并不是必需的。但是,如果希望直接访问文件,而不必使用 blob url,则可以使用以下步骤:
- 打开 blob url
- 在浏览器中打开 blob url 时,右键单击该文件并选择“另存为”
- 保存文件时,文件路径将显示文件的“真实”url
以上就是如何使用 Python 从法兰克福证券交易所下载 Blob 数据?的详细内容,更多请关注硕下网其它相关文章!