管理
切换导航
重启
关闭
Forum
Help
关于此页
JavaScript information
external
YaCy Tutorials
external
下载YaCy
external
社区(网络论坛)
external
Git存储库
Sponsor
YaCy is free software, so we need the help of many to support the development.
You
can help by joining a sponsoring plan:
external
become a Github Sponsor
external
become a YaCy Patreon
Please help! We need financial help to move on with the development!
Search
第一步
用法 & 账号
加载网页,爬虫
内存/硬盘 使用 &更新
监视
系统状态
索引浏览器
网络访问
爬虫监视
生产
高级爬虫
索引导出/导入
内容语义
目标分析
管理
索引管理
系统管理
过滤 & 黑名单
进程调度器
搜索门户集成
门户配置
门户设计
排名和启发式
加载网页
网站爬取
解析器配置
站点爬取
站点爬虫:
下载给定域名或者网址里的所有网页.
开始爬取站点
站点
起始地址 (头部必须有
http:// https:// ftp:// smb:// file://)
网址链接表
网址地图
路径
载入域中所有文件
仅载入给定网址子路径中文件
限制
不超过
文件
集合
启动
提示
爬取速度限制
每秒最多从同一主机中载入两个页面(每分钟不超过120个文件)以限制目标主机负载.
目标平衡器
对于不同主机的第二次爬取, 会上升到每分钟最多240个文件, 因为爬虫会自动平衡所有主机的负载.
高速爬取
当目标主机很多时, 用于多个主机(或站点)的'浅爬取'方式, 会增加每分钟页面数(ppm). 对应设置
专家模式起始爬取
选项.
定时器向导
可以使用
API向导
改变或删除爬取定时器.