博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
nutch 在hadoop环境下过滤抓取url的设置
阅读量:6443 次
发布时间:2019-06-23

本文共 267 字,大约阅读时间需要 1 分钟。

  hot3.png

分析:nutch在单机和hadoop环境下运行不一样, nutch目录下有一个runtime子目录,该子目录下有 local和deploy两个文件夹,local是本地运行的文件,deploy是分布式运行的文件,分布运行的conf文件应该打包到deyloy的apache-nutch-XX.job

中。所以,一旦要修改 nutch/conf中文件内容, 修改完后,需要ant一下,重新生成deyloy的apache-nutch-XX.job即可

转载于:https://my.oschina.net/sprint/blog/290202

你可能感兴趣的文章
阿里云重磅推出物联网设备身份认证Link ID²
查看>>
手把手教你vue配置请求本地json数据
查看>>
作为数据科学家,我都有哪些弱点?
查看>>
JavaScript数据精度缺失问题
查看>>
百度开源情感分析Senta,让你更懂用户
查看>>
Java 几种线程状态之间的相互关系
查看>>
史上最全Redis面试49题(含答案):哨兵+复制+事务+集群+持久化等
查看>>
SQLServer之多表联合查询
查看>>
MSSQLSERVER系统数据库的迁移
查看>>
js原生简单的上传图片
查看>>
刷面试题之<<携程 地面业务 前端面试经历>>
查看>>
node笔记(一)-http模块,url模块
查看>>
小程序学习笔记(1)
查看>>
React-新的生命周期(React16版本)
查看>>
vue 博客优化,服务端渲染(SSR)指南
查看>>
交互式数据可视化-D3.js(三)比例尺
查看>>
Python--Redis实战:第二章:使用Redis构建Web应用:第一节:登录和cookie缓存
查看>>
关于响应式布局,你必须要知道的
查看>>
去掉antd的Input组件获取焦点时的蓝色边框
查看>>
redis创建主从复制的过程
查看>>