今天把数据抽取的代码整理了下做了个控制台程序,这个程序主要抓取了新浪网的行业数据、股票信息股价日、周、月线的数据,并把数据存储到数据库文章末尾提供代码下载网址,代码可运行设置好数据库连接字符串后,即可抽取数据了
数据抽取主要是找到合适的数据源,分析和提取数据
免费的接口主要是各大门户网站和财经类网站,比如新浪网易的财经频道或者东方财富和和讯网站等。
另外如果想了解各种指数的成分股比如上证50,深户300等指数的成分股可以参考 ,这两个网站提供两市的所有股票数据提供了Excel下载,下载以后导入到数据即可
如果返囙数据不是json格式,那就需要用正则表示来提取了这方面就要看情况了,我的代码里部分用到了正则表达式
另外,为了防止网站接口变囮你需要建立一个接口类,为应用多做几个接口的实现应对后续网站接口的变化。