<address id="r9vd9"><address id="r9vd9"><listing id="r9vd9"></listing></address></address>

      歡迎您光臨深圳塔燈網絡科技有限公司!
      電話圖標 余先生:13699882642

      phpcms V9采集模塊如何操作

      發表日期:2018-06 文章編輯:小燈 瀏覽次數:3748

      采集模塊

      位置:內容 > 內容發布管理 > 采集管理 >

      模塊常用操作

      操作名說明
      采集流程詳述
      其它功能說明

      說明:

      文章的采集功能是通過程序來遠程獲取目標網頁內容,經過本地規則解析處理后存儲到服務器的數據庫內。

      文章采集系統顛覆傳統采集模式和流程,采集規則與采集界面分離,規則設置更簡單,只需有基礎技術知識的人員設置好相關規則。編輯人員無需了解太過細節的技 術規則,只需選中自己想要采集的文章列表,就可以像發布文章一樣,輕松地完成數據采集操作。
      一、采集流程
      簡單的講有三個步驟:
      1、添加采集點,填寫采集規則。
      2、采集網址,采集內容
      3、發布內容到指定欄目
      以采集新浪新聞(http://roll.news.sina.com.cn/news/gjxw/gjmtjj/index.shtml)為例,作一下詳細流程介紹。
      實例說明:
      目標:采集新浪新聞到V9系統 國際新聞 欄目中。
      目標網址:http://roll.news.sina.com.cn/news/gjxw/gjmtjj/index.shtml
      1、添加采集點
      1.1 網址規則配置
      添加采集點 - 網址規則配置圖1
      查看要采集的目標網址源代碼,查找到要采集網址的開始點和結束點(這二個點要有在整個源代碼里具有唯一性)。更進一步縮小采集網址搜索范圍。
      添加采集點 - 網址規則配置圖2
      測試你的網址采集規則是否正確,如下圖所示
      1.2 內容規則配置
      內容規則這里看起來比較復雜,其實也很簡單,為了便于說明,我們只采集標題、內容兩個字段。采集內容網址:
      http://news.sina.com.cn/w/2010-12-01/135121565455.shtml的內容采集規則,請你打開這個網址,然后頁面空白處右鍵->查看源文件搜索標題和內容的開始邊界。
      標題采集配置:
      從網頁<title></title>里取標題,并去除不需要的字符。如下圖
      內容采集配置:
      新浪新聞最終頁,新聞內容都包含在<!-- 正文內容 begin --> <!-- 正文內容 end --> 之間,而且這二個結點,在整個頁面源代碼中具有唯一性。所以可以以此為規則取內容。并對內容進行過濾。如下圖
      1.3 自定義規則
      1.4 高級配置
      可設置是否把圖片下載到服務器上,是否打水印等配置。
      2、采集網址,采集內容
      采集規則配好以后,即可進行網址的采集,然后進行內容的采集。

      3、發布內容到指定欄目

      選擇導入的欄目


      設置 采集內容與數據庫的字段對應關系.提交進行數據入庫,在此期間請耐心等待, 完成后會自動轉向。至此一個簡單的采集流程就操作完成。
      其它更多功能,期待你發掘。

      本頁內容由塔燈網絡科技有限公司通過網絡收集編輯所得,所有資料僅供用戶參考了本站不擁有所有權,如您認為本網頁中由涉嫌抄襲的內容,請及時與我們聯系,并提供相關證據,工作人員會在5工作日內聯系您,一經查實,本站立刻刪除侵權內容。本文鏈接:http://www.webpost.com.cn/3545.html
      相關cms文章
       八年  行業經驗

      多一份參考,總有益處

      聯系深圳網站公司塔燈網絡,免費獲得網站建設方案及報價

      咨詢相關問題或預約面談,可以通過以下方式與我們聯系

      業務熱線:余經理:13699882642

      Copyright ? 2013-2018 Tadeng NetWork Technology Co., LTD. All Rights Reserved.    

      国产成人精品综合在线观看