文本描述
数据源说明 p新能源汽车互联网数据监测的汽车范围为仅采用电力作为动力来源的汽车,即指纯电动汽车的所有车型; p监测的平台为汽车之家论坛,是国内最重要的汽车社交论坛。 汽车互联网口碑数据处理方法论 p通过网络爬虫获取汽车论坛上指定车型的评论内容及用户信息,将文字部分存入半结构化的数据库中; p对文字内容进行分词处理,对抓取的数据进行去重和垃圾数据清理后,结合用户信息和车型信息等结构化数据相关联; p最后进行综合分析,主要分析都基于论坛发文量(亦称“声量”)的统计来实现分析。 声量时间序列分析热度趋势 新增数据追加 社交媒体数据 品牌声量变化分析品牌占比 重复数据去除 品牌声量来源分析用户区域 汽车论坛 无关数据清理 内容分词 口碑正负表现分析用户情感 产品购买用途分析购买因素 售前售后声量分析品牌服务 正负口碑词云分析用户满意 新增标签 实时采集 数据存储 数据清洗 维度标签 My SQL + Solr ETL NLP分词 研究报告 API + 网络爬虫 注:本报告通过对品牌、时间、声量来源、正负向、购买用途和售前售后环节等维度的分析获取有价值的信息。 新能源汽车分品牌声量变化趋势 p所有品牌中比亚迪声量最高,北汽、特斯拉、江淮和众泰位于第二批队; p整体上4月、5月和6月份的声量较高,2月前后受到春节假期的影响的声量普遍较低。 各品牌汽车分月份声量变化趋势(2016.1-2016.11) 新能源汽车分品牌的声量排名 前十名的品牌 新能源汽车全年品牌声量 新能源汽车11月品牌声量