问题 C#.NET中用于处理javascripts的好的免费/付费Web Scraping库[关闭]


我正在寻找一个支持.NET的支持/免费网络抓取库,它支持JavaScript处理,并提供非常好的性能。

它应该有自己的浏览器引擎,并希望它自己的JS编译器。

如果该产品仅用于网页刮削,对我们来说将是一个巨大的优势。

我试过Watin和Selenium,但是它们都弹出了我们不想要的浏览器窗口。我想要一个没有浏览器窗口弹出的静默应用程序。

需要专家的帮助和宝贵的建议。


4693
2017-12-07 15:06


起源

我想建议辩论,争论,民意调查和扩展讨论是很棒的事情,SO提供的Q&A格式是一种很好的方式来促进它们。随着时间的推移,最受欢迎的民意调查回应以及最佳事实,参考和专业知识的论据都会被投票。 - Shavais


答案:


试试这可能会帮助你

http://www.webzinc.com/online/download.aspx

http://imacros.net/download/imacros/


13
2017-12-07 15:09





http://arachnode.net 可以帮助这个。

它使用mshtml.dll,它比AxShDocVw.dll低一步,它为WebBrowser控件提供动力。

它的每个线程大约快10倍(比使用.NET控件)并且用完了进程,因此您可以一次下载/渲染两个以上的页面。


2
2018-02-23 18:14



svn.arachnode.net/svn/arachnodenet/trunk/Renderer  用户名/密码:公共/公共删除对arachnode.net的引用,你将有一个无头的Javascript解析器用于Html使用及其他。翻转一个bool你会有一个头(更多?)实现。 - arachnode.net