Analizator de blog cu export în WordPress. Pluginul meu WP Uniparser este un parser universal pentru completarea automată a blogului!!! Pluginul pentru analizator

Parser pentru WordPress este o setare Datacol concepută pentru a colecta conținut (știri, articole, recenzii etc.) cu export ulterior către CMS WordPress.

În acest exemplu, conținutul rezultat este exportat în . Rezultatele pentru fiecare postare sunt salvate în dosar separat, al cărui titlu este generat pe baza titlului postării, iar conținutul este generat pe baza informațiilor analizate. De asemenea, puteți configura exportul direct pe blogul dvs. WordPress. Cum se face acest lucru este prezentat în videoclip.

Puteți testa gratuit analizatorul pentru WordPress în versiunea demo a programului.
Principalele avantaje ale parserului bazat pe Datacol pentru WordPress sunt:

  • Abilitatea de a personaliza analiza pentru WordPress în mod special pentru a se potrivi nevoilor dvs. (de dvs. sau).
  • Abilitatea de a procesa în continuare datele colectate folosind plugin-uri și, de asemenea, de a le încărca în .
  • Posibilitatea lansării ciclice a campaniilor. Când rezultatele primei sarcini de analizare vor fi intrarea pentru a doua sarcină de colectare a datelor. Citeşte mai mult.

Cum este utilizat analizatorul pentru WordPress?

Dacă ați creat un blog, atunci după ceva timp devine clar că este nevoie în mod constant de conținut nou unic pentru a-l promova. Și devii prea leneș să scrii singur articole și să completezi site-ul manual. Dar de unde poți obține conținut nou? Mai devreme sau mai târziu vine momentul când vrei să apelezi la autoblogging. Mai simplu spus, utilizați un parser care va publica singur informațiile de care avem nevoie. Un parser de conținut pentru WordPress ne va ajuta să facem față acestei sarcini.

Toate site-urile web au fost la un moment dat create de la zero. Dar dacă scopul site-ului tău este de a oferi informații, acesta va deveni interesant doar atunci când cantitatea de informații depășește o anumită cantitate. Analizatorul de blog WordPress este o soluție excelentă pentru o astfel de sarcină. Cu ajutorul acestuia, vă puteți ajunge din urmă concurenții într-un timp scurt, extinzând semnificativ catalogul de informații al site-ului. Parserul WordPress poate fi implementat ca un grabber pentru WordPress de pe un anumit site.

Analizator pentru Blog WordPress poate ajuta la rezolvarea multor probleme, iată câteva dintre ele:
— completarea inițială a resursei (un parser de site pentru WordPress vă va permite să vă completați blogul cu informații de la zero până la volumul necesar în cel mai scurt timp posibil);
— crearea unui blog auto-umplut (parserul WordPress va putea asigura actualizarea automată regulată a conținutului site-ului)
— publicarea conținutului „într-un program” (puteți programa timpul pentru a adăuga postări pe site-ul dvs.)

Postare în bloc în WordPress

Analizorul pentru WordPress prezentat în Datacol este un exemplu clar de utilizare a unui analizator pentru postarea în masă. Vă permite să primiți automat conținut și să îl publicați pe blogul dvs. Procesul de scraping WordPress poate fi împărțit în mai multe etape:

1) Procesul de colectare a conținutului. Analizorul WordPress colectează informațiile necesare pentru fiecare postare de blog: titlu, conținut (descărcat cu imagini care sunt salvate pe computerul dvs. pentru descărcare ulterioară prin FTP pe serverul dvs.), categoria, autorul și linkul de la care au fost colectate datele (URL).

2) Salvarea informațiilor colectate de parser pentru WordPress. După analizare, informațiile colectate sunt salvate fișiere TXT(fiecare postare este salvată într-un fișier text separat), ale cărui nume sunt generate în conformitate cu titlul postării.

3) Exportați WordPress. De asemenea, este posibil să exportați direct informațiile analizate pe blogul dvs. WordPress. Acest lucru face ca procesul de umplere să fie foarte rapid și elimină posibilitatea unor erori umane. Capacitatea de a exporta în WordPress este inclusă în funcționalitatea de bază a programului. Trebuie să specificați parametrii pentru conectarea la blogul dvs. în setările programului și să specificați datele de exportat (titlu, conținut, categorie etc.)

4) Prelucrarea informațiilor. Dacă se dorește, informațiile colectate în timpul procesului de parsare WordPress pot fi procesate (de exemplu, supuse traducerii automate sau sinonimizării). Aceste caracteristici sunt implementate folosind plugin-uri.

Cum să analizezi un site WordPress?

Nu numai că puteți publica informațiile analizate în WordPress, dar le puteți și răzui din ele. Sarcina de a utiliza blogurile WordPress ale altor persoane ca sursă de conținut pentru blogurile dvs. apare destul de des. Pentru a rezolva această problemă, un parser de site WordPress vă va ajuta. Algoritmul de lucru cu un parser de site WordPress este similar cu cel descris mai sus.

Beneficiile WordPress Website Parser

Probabil că sunteți deja convins că analizatorul de blog WordPress vă va ajuta să nu petreceți mult timp și efort pentru a vă completa manual blogul. Datorită acesteia, nu numai că vă puteți automatiza munca, ci și puteți crește eficiența acesteia. Puteți descărca analizatorul pentru WordPress, implementat în Datacol, la

Testarea analizorului blogului

Pentru a testa analizatorul de blog:

Pasul 2. Arborele campaniei conține campania content-parsers/kolchaka-net.par. Selectați-l și faceți clic pe butonul Redare. Înainte de a începe, puteți edita datele de intrare. În acest fel, puteți seta un link către blogul sau paginile blogului din care veți analiza conținutul.

Pasul 3. Așteptați să apară rezultatele analizei blogului. După ce apar rezultatele, puteți opri forțat analizarea (făcând clic pe butonul Stop).

click pe imagine pentru a mari

Pasul 4. După terminarea/oprirea forțată a parserului în folderul My Documents pe care îl puteți găsi fișiere text(fiecare postare este salvată într-un fișier separat), ale cărui nume sunt generate pe baza titlurilor postărilor:

click pe imagine pentru a mari

Uneori, nu are rost să-ți petreci timp scriind text pentru un site WordPress. Acest caz nu se aplică blogurilor și site-urilor de informații, deoarece veniturile acestora sunt generate tocmai datorită postărilor postate.

Și vorbim de magazine online, site-uri web ale companiilor și portaluri de știri care nu sunt concepute pentru trafic organic. Pentru astfel de resurse, materialele unice nu sunt la fel de importante ca actualizarea lor constantă.

Pentru a crea un site de completare automată, va trebui să configurați un parser de știri pentru proiectul dvs. Mai întâi trebuie să găsiți site-uri potrivite de pe care să răzuiți. Acestea trebuie să corespundă subiectului proiectului dvs., altfel nu are rost să duplicați informații de la ele. Dacă acesta este cazul, atunci trebuie să treceți la a doua parte a soluției la problema de analiză - așa veți clona text de pe alt site. Cea mai primitivă și incomodă metodă este copierea manuală. Dar este mult mai înțelept să folosiți unul dintre pluginurile prezentate în acest articol pentru a activa un analizator de știri și conținut de succes.

WP-O-Matic

Un modul foarte popular pentru WordPress care vă va permite să configurați un parser funcțional de știri de pe alte site-uri. Instrumentul este instalat de într-un mod simplu: fie prin încărcare direct într-un folder de pe găzduire, fie prin fila „Plugins”.

Apoi, trebuie să configurați pluginul dacă doriți să asigurați analizarea conținutului. Pentru a face acest lucru, faceți clic pe „Următorul” de patru ori și la sfârșit pe „Trimite”. Astfel, vă confirmați acordul cu termenii de utilizare a acestui modul WordPress. În special, sunteți de acord că sunteți singurul responsabil pentru furtul de materiale ale altor persoane, conținut de pe alte site-uri etc.

Dacă, pe lângă componenta text, sunteți interesat și de imagini, atunci trebuie să creați un director numit Cache în folderul cu pluginul. Setați drepturi speciale de acces la acest folder. În continuare trebuie să te întorci la Administrator WordPress. Accesați setările pluginului și uitați-vă cu atenție pentru a vedea dacă există o bifă lângă elementul cron Unix. Trebuie să bifați în mod afirmativ caseta Cache Image, astfel încât analizatorul de știri să copieze și imaginile în resursa dvs.

Modulul WP-O-Matic este bun pentru că funcționează pe orice pagină a site-ului. Puteți adăuga o categorie separată dacă doriți ca lista de știri și conținut furnizate de parser să fie afișată acolo. Pentru a face acest lucru, creați mai întâi categoria necesară. Apoi, în administratorul WordPress din setările instrumentului WP-O-Matic, faceți clic pe Adăugare campanie. În linia Categorii, bifați categoria specială pe care ați creat-o. Și în formularul Feeds, introduceți fluxul RSS pe care urmează să îl analizați. Puteți introduce mai multe adrese URL pentru fluxuri simultan, astfel încât analizatorul de text să colecteze informații din trei sau chiar patru resurse simultan.

Și un alt plus uriaș în direcția plugin-ului WP-O-Matic este publicarea automată a materialului. Nu trebuie să vă conectați la administratorul WordPress în fiecare oră pentru a schimba starea postărilor în „Publicate”. Modulul va face acest lucru singur. Iar dacă doriți, poate uniciza textul printr-un mecanism special de sinonimizare. Aceasta este diferența cheie dintre acest instrument și concurentul său - pluginul FeedWordPress.

Datacol

Acesta este un grabber funcțional care este potrivit nu numai pentru motorul WordPress. Acesta nu este doar un parser de text pentru paginile site-ului web - este aplicație inteligentă, care vă permite să filtrați materialul copiat. De exemplu, veți putea posta numai articole care conțin anumite cuvinte cheie. Puteți duplica știrile direct de la Yandex. Materialele clonate vor fi exportate într-unul dintre cele 15 formate disponibile. Serviciul va colecta nu numai text, ci și titluri, fotografii, data publicării, link-uri și alte date importante.

Dar Datacol este distribuit pe bază de plată. Cu toate acestea, este mult mai ieftin decât dacă ai comanda material pe site prin schimburi. Aplicația costă mai puțin de 500 de ruble și poate fi folosită pentru aproape orice motor. Există o versiune demo.

FDE Grabber

Un alt parser plătit cu un număr mare de funcții. Acesta este deja în categoria grabber-urilor scumpe, deoarece va costa aproximativ 90 USD. Dar va fi posibil să-l folosești pe 10 servere deodată, adică, în teorie, diferiți webmasteri pot cip în 9 dolari fiecare, făcând astfel achiziția mai ieftină.

FDE Grabber nu este tocmai un plugin WordPress. Dezvoltatorii numesc creația lor un sistem autonom care funcționează indiferent de tipul de CMS instalat pe site. Principalele caracteristici ale acestui sistem de analiză:

  • descărcarea de știri la scară largă sau fragmente individuale;
  • puteți programa publicații;
  • dacă doriți să unificați materialul duplicat, există o funcție de sinonimizare încorporată;
  • puteți lucra prin servere proxy;
  • analizarea este capabilă să ocolească redirecționările, ceea ce poate fi o problemă pentru alte plugin-uri;
  • puteți descărca automat tot conținutul de pe site și îl puteți muta pe site-ul dvs. (dacă este vorba de portaluri care nu sunt de știri);

Puteți configura parsarea complet la propria discreție, deoarece programul are capacitatea de a implementa microprograme pentru a corecta munca. De exemplu, în acest fel puteți personaliza alinierea și designul materialului copiat. De asemenea, puteți adăuga parametrii noindex și nofollow pentru toate linkurile care vor fi în textul paginii. Analizatorul vă permite chiar să copiați și să traduceți automat articole din resurse străine. Aceasta este o modalitate excelentă de a crea un flux constant de conținut pe paginile tale, care va începe să atragă vizitatori în timp!

Un parser universal destul de puternic pentru WordPress. Vă permite să colectați conținut din una sau mai multe surse și să-l procesați, adaptându-l la formatul necesar folosind toate capacitățile limbajului PHP. Există posibilitatea unei analize întârziate. Cel mai bun analizator gratuit pentru WordPress în acest moment - AftParser este întotdeauna la dispoziția dumneavoastră!

Scurtă descriere a funcționalității:

Analizorul este format din 4 pagini: Pagina de pornire, Pagina de analiză a linkurilor, Pagina de analiză a fluxului RSS și pagina de setări. Iată cum va arăta după instalare:

Atenţie: Puteți citi cum să configurați AftParser.

Să începem cu pagina de start. Afișează o listă de analizoare care rulează în prezent.

Explicațiile sunt furnizate în blocuri pe fiecare pagină. Toată documentația iese din cutie, doar citiți-o cu atenție pentru a clarifica totul.

Analizor de site:

Pagina de analiză a site-ului vă permite să analizați date atât din una, cât și din mai multe surse. Trebuie doar să furnizați link-uri către materiale.

Ce? Prea leneș să parcurgeți internetul și să adune materiale manual? Nu disperați - totul este automat.

Există două instrumente care vă permit să completați automat lista de linkuri.

- un fel de emulare motor de căutare. Robotul va parcurge însuși paginile site-ului transferate către acesta și va colecta toate linkurile interne de la acestea.

Desigur, o listă de link-uri plină cu algoritmi automati va fi puternic înfundată cu date inutile. Și aici filtrele vă vin în ajutor.

- cel mai simplu și cale rapidă filtrare. Introduceți condițiile și filtrul realizează singur procesarea.

Filtru de link avansat- un filtru de link care vă permite să le schimbați conținutul și să faceți o grămadă de alte lucruri diferite. Numai pentru utilizatori avansați. Vă sfătuiesc să învățați php înainte de a face ceva acolo.

Dacă ați finalizat colecția de linkuri, următorul pas este să adăugați limite de conținut.

Folosind aceste limite, analizatorul va determina zonele care trebuie procesate.

Evidențierea sintaxelor este implementată folosind editorul javascript ACE. Toată documentația și toate funcțiile disponibile sunt furnizate pe pagina de plugin. Lista este foarte impresionantă și nu o pot prezenta aici, deoarece acest material este deja foarte lung. Doar instalați pluginul și citiți, veți fi impresionați, vă garantez.

Așa arată pagina Analizor de flux RSS, cu singura diferență că nu există nicio cerință de a furniza liste de link-uri.

Vă prezint universalul Utilizator WordPress WP UniParser. Acest plugin este parser universal personalizabil. La crearea postărilor, pluginul poate traduce conținut prin serviciu Google Traduceți folosind orice pereche de limbi.

Recenziile clienților

Subiectul de pe server, unde erau aproximativ 6-7 recenzii, a fost șters de moderatori (ei spun că produsul nu respectă regulile forumului). Cu toate acestea, o recenzie poate fi citită pe forumul Mulnet și Armada. Există și recenzii de la bloggeri: aici și aici. Destul de recent am dat din greșeală peste o recenzie.

Funcționalitate de bază

Pluginul WP UniParser pe care l-am creat poate face următoarele:
extrage conținut din site-uri pe orice motoare(parserul este configurat folosind expresii regulateși șiruri de restricții, setarea este foarte simplă, voi explica și arăta totul, în plus, există un );
tăiați scripturile, comentariile, linkurile, formularele, imaginile, secțiunile, obiectele, precum și orice fragmente pe care le specificați din conținut.
publicarea planului posturi;
puneți materialele analizate într-o categorie pe care o definiți (sau distribuiți-le aleatoriu în categorii);
realiza traducere automată (în orice direcție) în orice limbă acceptată de Google Translate.

Puteți afla mai multe despre setul de funcții ale pluginului în captura de ecran a panoului său de administrare:

De asemenea, merită să înțelegeți pe deplin funcționarea apucătorului universal.

Există destul de multe domenii de activitate în care un parser poate fi folosit, dar în principal este colecția de informații diverse. Puteți colecta rapid imagini și link-uri numai în mod programatic. Utilizarea unui parser pentru a căuta informații vă permite să automatizați acest proces, economisind semnificativ timp. Dacă aveți un site web pe Wordpress, atunci îl puteți completa cu ușurință folosind analizatorul AftParser.

este un parser universal gratuit pentru WordPress. vă permite să colectați conținut din una sau mai multe surse, procesându-l sub formatul necesarîn limbajul PHP. Analizatorul este realizat ca un plugin pentru WordPress. După instalarea normală a pluginului, în consola WordPress va apărea un meniu de parser, ca în imagine.

Analizorul implementează două instrumente principale: analizatorul site-ului WordPress și analizatorul rss Wordpress.

Parserul pentru WordPress poate:

1. Parsează datele din linkuri

Trebuie doar să furnizați link-uri către sursă. Dacă nu există legături, acestea pot fi colectate de un parser. Specificați calea către harta site-ului și grabber-ul va colecta toate linkurile. Sau puteți colecta link-uri de la oricare pagini html. Legăturile pot fi filtrate în funcție de criteriile dorite. Există două filtre de legătură cu care puteți modifica condițiile de analizare. Utilizatorii experimentați pot crea ei înșiși macrocomenzi de analiză, ceea ce face ca analizatorul să fie foarte flexibil pentru a se potrivi nevoilor lor.

2. Analizează datele fluxului RSS

Totul este simplu aici, introduceți adresa URL a feedului dorit și faceți clic pe Start parsing.
Una dintre posibilele utilizări ale analizorului wordpress este completarea coloanelor de știri de pe site-ul dvs. folosind surse de informații precum bloguri, fluxuri rss, paginile VKontakte etc. Concurenți - WP-O-Matic, FeedWordPress, CyberSyn.