Crawler Html 3T
Đây là thư viện dùng để bóc tách dữ liệu html
Installation
npm install crawler-html-3t --save
Usage
ModelMongoose
Class - mod_sources
- name_index
- SourcesNews
- Articles
- mod_baogom
- name_index
- mod_acticles
- mod_links
- mod_categories
HtmlParser
Class - GetHtmlDoc
- body: html
- $: jquery
HtmlExtract
Class - getTitle
var title = ;
- getDesc
var description = ;
- getImage
var url_image = ;
ReadRss
Class - getListFeed
- getListFeedByBodyXml