nodejs爬虫小试

var http = require('http');
var cheerio = require('cheerio');
var url='http://www.moozik.cn/'

http.get(url,function(res){
    var html = ';
    res.setEncoding('utf-8'); //防止中文乱码

    //监听data事件,每次取一块数据
    res.on('data', function (chunk) { 
        html += chunk;
    });

    //监听end事件,如果整个网页内容的html都获取完毕,就执行回调函数
    res.on('end', function () {
        var $ = cheerio.load(html); //采用cheerio模块解析html

        var str1 = $('.logoTheme').children().eq(0).text().trim()
        var str2 = $('.logoTheme').children().eq(1).text().trim()
        console.log(str1,str2);
    });
});

不说怎么安装和配置了,觉得用nodejs做爬虫有个好处就是取数据很方便,也支持很多库,只是不算主流,资料比较少,就只是尝试一下到此为止吧。

最后修改:2019 年 11 月 13 日 12 : 47 AM

发表评论