浣石采集器是一款领先的互联网数据采集器,集数据采集、清洗、分析、可视化、洞察及报告生成于一体,助力用户高效精准地采集并深度分析互联网数据,生成富有洞察力的分析报告。
在信息过载的时代,关键在于如何从海量原始数据中提炼核心信息。浣石采集器不仅具备强大功能,还注重细节打磨,既提升了数据处理效率,又保证了分析的精准度,让用户快速获取所需信息。我们努力为每位用户带来愉悦的使用体验,操作简便易懂,无需复杂设置即可快速完成数据采集与分析。
基于对大模型技术的深刻思考,我们的代码解释器提供强大灵活的数据预处理功能,免除了用户在自定义采集阶段的繁琐配置工作。我们的目标不仅是为用户提供一款既实用又富有质感的智能工具,帮助用户做出更高质量的数据驱动决策,更是向用户直接交付结果,包括可视化图表、分析报告,以及它们赖以生成的基础——从互联网精准采集的原始数据。

首次使用,请完成注册并登录账号。支持手机号、QQ、微信等多种方式。

注册后将自动跳转至首页。
您可以在搜索框中输入您感兴趣的数据后,点击搜索图标或按回车键,下拉框会展示匹配的搜索结果。点击列表项可在浏览器中浏览对应网址,此外,您还可以进行自定义采集、网页总结、网页生成思维导图、知识图谱和深度搜索。
首页包含三个模块:
a. 今日热搜:展示每日热门内容,支持一键采集、网页总结、生成思维导图、知识图谱及深度搜索。
b. 采集模板:精选热门模板,可直接点击【开始采集】或查看更多模板。
c. 专属定制服务:可提交个性化数据处理需求,我们的顾问将与您联系,量身定制解决方案。

支持自动化网页内容识别和手动点选,操作向导、流程图交互友好直观,数据预览一目了然、任务设置全面灵活,包含了多样的强化采集服务和3种加速机制。
在输入框内输入一个或多个网址,以shift+回车键换行,点击【开始采集】按钮(或直接按回车键启动采集任务)。您还可以开启输入框右侧的开关,在采集过程中对目标网址进行深度搜索。

自定义采集有2种方式:元素智能识别、自定义配置采集
a. 元素智能识别
输入网址后,自动识别网页数据,以下是一个元素智能识别的示例,示例网址为https://nba.hupu.com/stats/players。
步骤一:输入目标网址,点击【开始采集】。浣石采集器自动打开网页,您可以点击侧边栏或下方操作向导的【元素智能识别】按钮,智能识别网页中的结构化数据。

提醒:识别过程中,随时可【取消自动识别】或【不再自动识别】。
步骤二:元素智能识别成功后,如识别到多组数据,可自行【切换识别结果】。

步骤三:根据需要设置网页的滚动加载规则。

步骤四:点击【生成采集设置】生成对应的采集流程。
步骤五:点击【生成采集任务】或右上角【采集】按钮开始采集网页数据。

步骤六:采集完成后,可【导出数据】或【关闭】。

特别提醒:采集完成的数据会保存至【任务】模块,随时可再次查看或导出。
b. 自定义配置采集(手动选择网页元素)
示例网址:https://ecp.cgnpc.com.cn/zbgg.html
进入采集页后,左侧显示流程图与设置,底部是操作向导与数据预览,目前没有配置规则,所以数据为空。

通过点选网页上的元素,网页内被选中的数据会出现蓝色高亮提示,同时操作向导也随动变化,此时可进行【提取数据】、【鼠标操作】或【提取全部相似元素】

选中【提取全部相似元素】可看见底部数据预览部分出现数据,此时可根据网页配置翻页方式,实现多页数据采集。

设置完所有步骤后,点击【生成采集任务】或点击右上角【采集】开始采集网页数据。采集完成后,可选择【导出数据】或【关闭】
在点选网页元素的同时,左边的流程图与设置也会发生对应的变化,将鼠标移动到流程图两个图元中间的位置,会出现添加按钮。点击按钮,可快速添加流程步骤。

点击【流程图】的每个图元,会在下方呈现对应的设置页面,选择需要执行的操作后,点击后下角【应用】保存。

侧边栏支持
a. 折叠/展开流程图
b. 浏览模式:点击左边栏【浏览模式】可以在像浏览器中一样正常点击网页。
c. 元素智能识别:智能识别网页中的结构化数据。
d. 预登录:点击左边栏【预登录】可登录网站,登录完成后点击【关闭并提交Cookies】可保存您的登录信息。
e. 设置:点击左边栏【设置】可对该自定义采集任务设置相关操作。
f. 保存:保存采集任务,可到【任务】模块查看。
浣石采集器提供了1125个模板,涵盖国内外主流网站的多种数据,此外,采集模板还在不断的增加。
可按您的喜好调整卡片/表格视图显示。

下面是模板采集的示例:
步骤一:在搜索框输入需要的网站名称,选择合适模板。

步骤二:点击【开始采集】进入模板详情页配置参数,按所需设置采集页数,关键词等。

特别提醒:部分网站需要预登录,采集模板前请阅读使用说明和注意事项。
步骤三:点击【普通采集】/【加速采集】启动任务。
提示:【加速采集】适用于文本循环、网址循环或固定元素循环的任务。

步骤四:采集完成后,可选择【导出数据】或【关闭】

浣石采集器提供灵活多样的采集任务设置,满足您最苛刻的数据采集需求,包含了定时采集,强化采集,数据导出与智能分析等功能。
可按您的喜好调整卡片/表格视图显示

a. 采集任务设置,可对任务进行常规、强化采集、AI数据处理操作

b. 启动,您可以直接在【任务】中采集保存的任务

c. 预览数据,点击【查看数据】可预览采集到的数据

d. 操作,点击按钮导出文件保存至本地,右击可选择更多的导出数据保存类型

特别提醒:可在【采集任务设置】里设置文件导出路径
e. AI数据处理
您可以对采集完成的数据进行数据处理,浣小石支持【数据总结】、【仪表盘】、【思维导图】、【知识图谱】、【数据清洗】、【数据分析】、【数据挖掘】、【数据洞察】、【数据可视化】、【分析报告】、【深度搜索】等多种多样的处理功能,帮助您更高效的、更专业分析、呈现、分享和利用各种价值信息。
部分任务提供【高级定制处理工具】,对采集数据实现更加独特高级的处理
特别提醒:AI数据处理默认处理最新任务的采集数据,可选择处理所有任务采集数据。
浣小石为您提供全程智能服务,从互联网数据采集到清洗、分析、挖掘、洞察与可视化,以17种浣小石触发方式,支持生成仪表盘、数据总结、思维导图、知识图谱、分析报告(docx、pdf)、深度搜索,并提供持续增加的高级定制处理工具,助力您的数据处理更精准更快捷。

在输入框内输入您的需求或问题,浣小石将迅速响应,同时,提供实用的辅助工具:
【深度思索】:深入智能分析您的问题或需求
【联网搜索】:实时联网获取最新的网络资源和信息
【上传文件】:上传本地文件供浣小石分析处理
特别提醒
浣小石目前为Beta版,我们正在不断优化其功能。在处理不同类型的数据时,系统的表现可能会有所不同,部分复杂或特殊格式的数据可能需要更多的处理时间或调整。初次运行代码解释器时,出现报错是正常现象,系统具备自动纠错功能,会及时修复错误并继续执行任务。我们正在持续改进,以提升用户体验和处理能力,感谢您的理解与支持!