从redditurl获取原始url

考虑以下链接: https://www.reddit.com/r/todayilearned/comments/6x6iz8/til_princess_diana_on_live_tv_shook_the_hand_of/?ref=share&ref_source=link : https://www.reddit.com/r/todayilearned/comments/6x6iz8/til_princess_diana_on_live_tv_shook_the_hand_of/?ref=share&ref_source=link link

原来的样子是

http://www.bbc.com/news/av/magazine-39490507/how-princess-diana-changed-attitudes-to-aids

使用Javascript,我怎么能从第一个链接到原始链接,而不使用Reddit API?

如果您正在讨论在网页中运行的JavaScript,则不能。 您需要使用Reddit API,或者刮擦Reddit网页。 但是,由于跨源安全规则,您无法使用JavaScript来抓取网页,因此您必须使用该API。

编辑:啊,保罗只是指出,你标记的Node.js; 如果你是从服务器做到这一点,可以刮。 查找“用node.js进行刮擦”。 经过粗略浏览一下Google,看起来大多数解决scheme都是通过下载Reddit网页的HTML,然后用名为cheerio的库来parsing。 还有这个东西刮 – 它看起来很有前途。