精选高质量数据集,覆盖多个行业领域
京东、淘宝等主流电商平台商品信息、价格、评价数据
淘宝、天猫、京东、拼多多等全平台的销量、销售额、客单价、订单量、退款率、转化率
浏览量、加购率、收藏率、搜索关键词、用户画像、复购率、用户留存
直播带货GMV、达人佣金、广告投放ROI、优惠券使用、活动大促数据(618/双11)
微博、知乎等社交平台用户信息、话题讨论、舆情数据
短视频/图文/直播的播放量、点赞、评论、转发、收藏、完播率、爆款内容、话题热度
KOL/KOC粉丝量、带货数据、广告投放效果、品牌声量、舆情监测、竞品营销数据
好友关系、社群互动、圈层文化、用户社交行为轨迹
股票行情、基金净值、公司财报、行业分析等金融数据
A股、港股、美股、期货、期权、基金、债券、ETF的行情、K线、成交量、持仓、龙虎榜、研报
GDP、CPI、PPI、利率、汇率、M2、社融、失业率、进出口数据、财政数据
第三方支付(支付宝/微信支付)、消费贷、信用卡、征信数据、普惠金融数据
航班信息、酒店价格、旅游景点评分、出行攻略数据
机票、火车票、汽车票、网约车(滴滴/高德)、出租车、地铁、公交的班次、票价、客流量、准点率
携程、美团、飞猪、去哪儿、同程、Airbnb等平台的酒店价格、入住率、预订量、评分、房源数据
景区客流量、门票数据、旅游人次、旅游收入、热门目的地、旅游攻略、签证数据
企业注册信息、股东结构、经营范围、法律诉讼等数据
企业名称、统一社会信用代码、法人、股东、注册资本、成立日期、注册地址、经营范围
存续/注销/吊销、行政处罚、经营异常、严重违法失信、司法诉讼、被执行人、限制高消费
股权结构、股东出资、股权变更、融资轮次、投资机构、估值、并购重组
主流新闻网站文章、评论、热点话题、舆情监控数据
央视、人民日报、新华社等官媒,新浪、网易、腾讯、搜狐等门户,澎湃、界面等新媒体,行业垂直媒体
全网舆情监测、热点事件、舆论走向、品牌舆情、竞品舆情、负面信息预警
各行业(科技/金融/医疗/汽车等)的行业动态、政策法规、产业报告、市场分析
汽车报价、配置参数、销量数据、用户口碑评测
乘用车/商用车的销量、产量、上牌量、库存、车企排名、品牌市占率、新能源汽车数据
车型参数、配置、价格、优惠、口碑、销量排名、新车上市数据、二手车数据
汽车维修、保养、保险、金融、改装、加油站、充电桩数据
2015年至今A股上市公司的财经新闻数据
医院信息、药品数据、疾病百科、健康资讯
医院、诊所、体检中心的等级、科室、医生信息、挂号数据、诊疗量、口碑评分
药品价格、医保目录、药品销量、医疗器械备案、集采数据、药企研发数据
在线问诊、互联网医院、医药电商、远程医疗、AI医疗数据
学校信息、课程数据、培训机构、在线教育资源
新东方、学而思、猿辅导、作业帮等机构的课程、价格、学员数、营收、口碑
中小学、高校、职业院校的招生数据、录取分数线、就业率、专业排名、学科建设
网课平台(网易云课堂、腾讯课堂、慕课)、课程销量、学员学习数据、完课率、留存率
ID, Name, City, Country code, Position, About, Posts, Current company, and more.
Title, Seller name, Brand, Description, Initial price, Currency, Availability, Reviews count, and more.
ID, Name, Country code, Locations, Followers, Employees in linkedin, About, Specialties, and more.
Account, Fbid, ID, Followers, Posts count, Is business account, Is professional account, Is verified, and more.
Name, URL, ID, Cb rank, Region, About, Industries, Operating status, and more.
URL, Job posting id, Job title, Company name, Company id, Job location, Job summary, Job seniority level, and more.
URL, User posted, Description, Hashtags, Num comments, Date posted, Likes, Photos, and more.
Zpid, City, State, HomeStatus, Address, IsListingClaimedByCurrentSignedInUser, IsCurrentSignedInAgentResponsible, Bedrooms, and more.
URL, ID, User id, Use url, Title, Headline, Post text, Date posted, and more.
Place id, URL, Country, Name, Category, Address, Description, Business details, and more.
ID, User posted, Name, Description, Date posted, Photos, URL, Quoted post, and more.
Account id, Nickname, Biography, Awg engagement rate, Comment engagement rate, Like engagement rate, Bio link, Predicted lang, and more.
URL, Title, Youtuber, Youtuber md5, Video url, Video length, Likes, Views, and more.
URL, Product name, Product rating, Product rating object, Product rating max, Rating, Author name, Asin, and more.
URL, Post id, User url, User username raw, Content, Date posted, Hashtags, Num comments, and more.
URL, Post id, Description, Create time, Digg count, Share count, Collect count, Comment count, and more.
Jobid, Company name, Date posted parsed, Job title, Description text, Benefits, Qualifications, Job type, and more.
URL, ID, Title, Rating, Reviews, Initial price, Final price, Currency, and more.
URL, ID lc, Name lc, Country code lc, Locations lc, Followers lc, Employees in linkedin lc, About lc, and more.
URL, Final price, Sku, Currency, Gtin, Specifications, Image urls, Top reviews, and more.
URL, Profile url, Linkedin num id, Avatar, Profile name, Certifications, Profile location, Profile connections, and more.
URL, Title, Available, Description, Currency, Initial price, Final price, Discount percent, and more.
URL, Handle, Handle md5, Banner img, Profile image, Name, Subscribers, Description, and more.
ID, Company, Ratings overall, Details size, Details founded, Details type, Country code, Company type, and more.
URL, Place id, Place name, Country, Address, Review id, Reviewer name, Reviews by reviewer, and more.
Post id, URL, User posted, Title, Description, Num comments, Date posted, Community name, and more.
Name, Price, Image, Description, Category, Availability, Discount, Reviews, and more.
X id, URL, ID, Profile name, Biography, Is verified, Profile image link, External link, and more.
Title, Popularity, Genres, Presentation, Credit, Videos, Photos, Top cast, and more.
URL, User posted, Description, Hashtags, Num comments, Date posted, Likes, Views, and more.
URL, Title, Publisher, Date, Category, Keyword, Country, Image, and more.
Name, Company id, Entity type, Summary, Stock ticker, Currency, Earnings date, Exchange, and more.
Overview id, Review id, Review url, Rating date, Count helpful, Count unhelpful, Employee job end year, Employee length, and more.
URL, Hotel id, Title, Location, Count, and more.
灵活选择最适合您的数据获取方式
实时调用,按需获取,支持高并发
CSV/JSON/Excel,批量导出
海量数据,物理交付,安全可靠
Kafka/Webhook,实时推送
告诉我们您的需求,我们会在24小时内为您定制采集方案,专业团队全程跟进
透明定价,根据数据量和交付方式灵活组合
结构化数据直接接入大模型,让AI更智能
所有数据集均提供JSON Schema定义,字段含义清晰,类型严格校验,可直接映射到大模型的Function Calling参数
提供OpenAI Function格式兼容的API描述文件,复制即可接入GPT/Claude等主流大模型Agent框架
支持Webhook回调与定时推送,AI Agent可自动触发数据更新,无需人工干预,实现端到端自动化
关于数据集服务的常见疑问
我们的数据均来自公开可访问的互联网网站,严格遵守《网络安全法》和《数据安全法》等相关法律法规。采集过程中尊重robots.txt协议,不采集任何个人隐私数据。所有数据均经过合规审核,确保合法合规。
不同数据集的更新频率不同:新闻资讯类数据实时更新;电商价格类数据每日更新;企业工商类数据每周更新;部分静态数据集为一次性交付。您也可以根据需求定制更新频率。
每个数据集都提供免费的样本数据(通常为100-500条),您可以在数据集详情页直接下载。如需更大规模的测试数据,请联系客服申请。
我们支持JSON、CSV、Excel、XML等常见数据格式。对于API交付方式,返回标准JSON格式;对于文件下载,可在下单时选择所需格式;大数据量场景支持数据库直连或硬盘邮寄。
我们采用多重数据质量保障机制:1)采集阶段自动去重和格式校验;2)清洗阶段异常值检测和修正;3)交付前人工抽样审核;4)提供数据质量报告。如发现数据质量问题,可申请免费重新采集。
我们提供OpenAI Function Calling兼容的API描述文件,您只需将描述文件复制到Agent配置中即可接入。同时支持LangChain、AutoGPT等主流Agent框架的适配器。详细接入文档请参考帮助中心。