Materiali isolanti Isolamento Blocchi

Strumenti di ricerca. determinare lo scopo della ricerca di informazioni. condurre una ricerca nelle risorse informative


Dopo aver studiato questo argomento, imparerai e ripeterai:

A cosa servono i server di ricerca?
- scopo delle parti principali dei server di ricerca;
- quali tipi di ricerca di informazioni esistono su Internet;
- regole di base per formare una query nel motore di ricerca Yandex.

Cerca per URL

Il modo più rapido e affidabile per cercare informazioni su Internet è eseguire la ricerca tramite URL. Molti di essi sono presentati in pubblicazioni stampate, libri di consultazione speciali e vengono ascoltati nelle stazioni radio popolari e sugli schermi televisivi.

♦ I tifosi della squadra di calcio Zenit conoscono a memoria l'indirizzo www.fc-zenit.ru.
♦ I fan del gruppo “Il re e il giullare” conoscono bene il sito ufficiale di questo gruppo www.korol.spb.ru.
♦ I fan del canale NTV possono facilmente trovare il suo sito web all'indirizzo www.ntv.ru. Per accedere rapidamente alle risorse di cui sopra, avvia semplicemente un programma browser, come Internet Explorer, e digita un URL familiare nella barra degli indirizzi.

Motori di ricerca

C'è un'enorme quantità di documenti concentrati su Internet. Per facilitare la ricerca delle informazioni necessarie, vengono creati motori di ricerca speciali.

Motori di ricerca- si tratta di sistemi automatici che interrogano i server collegati alla rete globale e memorizzano nei loro database informazioni sui dati disponibili sui server. Sulla base di una query appositamente formulata, i motori di ricerca forniscono informazioni su dove è possibile ottenere i dati necessari.

Tipicamente, i motori di ricerca sono costituiti da tre parti: robot, programma di elaborazione di indici e query.

Robot (Ragno, Robot o Bot)è un programma che visita pagine web e legge (in tutto o in parte) il loro contenuto. I robot dei motori di ricerca differiscono nel loro schema individuale per analizzare il contenuto di una pagina web.
Indice motore di ricerca è un archivio di immagini di ricerca delle pagine visitate dai robot. Un'immagine di ricerca di un documento (inclusa una pagina web) è una descrizione del contenuto del documento in uno speciale linguaggio di recupero delle informazioni. Questa descrizione contiene codici di parole chiave del documento che ne riflettono il significato e il contenuto. Gli indici in ciascun motore di ricerca differiscono nel volume e nel metodo di organizzazione delle informazioni archiviate. I database dei principali motori di ricerca memorizzano informazioni su decine di milioni di documenti e il volume dei loro indici ammonta a centinaia di gigabyte. Gli indici vengono periodicamente aggiornati e integrati, quindi i risultati di un motore di ricerca con la stessa query potrebbero differire se la ricerca è stata effettuata in momenti diversi.

Programma di elaborazione delle richiesteè un programma che, in base alla richiesta dell'utente, “cerca” nell'indice la presenza delle informazioni necessarie e restituisce i collegamenti ai documenti trovati. L'insieme dei collegamenti all'uscita del sistema viene distribuito dal programma in ordine decrescente di rilevanza, cioè dal maggior grado di corrispondenza del collegamento alla richiesta al minore.

Attualmente, i più popolari tra gli utenti Internet russi sono tre grandi motori di ricerca di tipo indice:

Questi sistemi tengono conto caratteristiche grammaticali Lingua russa, quindi i risultati della loro ricerca nelle risorse in lingua russa sono di qualità superiore rispetto a quelli dei sistemi occidentali.

I motori di ricerca variano in copertura risorse informative:

♦ i motori di ricerca generali dispongono di un database in tutte le aree della conoscenza e si distinguono per un ampio indice e un grande volume di informazioni accumulate;
♦ I motori di ricerca per scopi specifici esaminano solo i siti su un argomento specifico, come musica o musei.

Le principali caratteristiche dei motori di ricerca sono:

♦ volume dei documenti presenti nell'indice;
♦ frequenza di aggiornamento delle informazioni;
♦ lo spazio informativo coperto dal robot del motore di ricerca e la varietà di tipi di documenti sui quali vengono raccolte le informazioni;
♦ velocità di elaborazione delle richieste;
♦ criterio per determinare la pertinenza (conformità del documento trovato con la query di ricerca);
♦ la capacità di dettagliare e chiarire la richiesta.

Cerca per categoria del motore di ricerca

Le directory di ricerca sono una raccolta (selezione) sistematica di collegamenti ad altre risorse Internet. I collegamenti sono organizzati sotto forma di rubricatrice tematica, ovvero una struttura gerarchica, scorrendo la quale è possibile trovare le informazioni di cui si ha bisogno.

Diamo come esempio la struttura del catalogo di ricerca Internet Yandex. Questa è una directory scopo generale, poiché contiene collegamenti a risorse Internet in quasi tutte le aree possibili. In questo catalogo vengono evidenziati i seguenti argomenti:

♦ Commercio ed economia;
♦ Directory e collegamenti;
♦ Società e politica;
♦ Casa e famiglia;
♦ Scienza e istruzione;
♦ Intrattenimento e relax;
♦ Computer e comunicazioni;
♦ Cultura e arte.

Ogni argomento comprende molte sottosezioni e queste, a loro volta, contengono titoli, ecc.

Supponiamo che tu stia preparando un evento per il Giorno della Vittoria e desideri trovare su Internet le parole della famosa canzone militare di Bulat Okudzhava "Senti gli stivali tintinnare". La ricerca può essere organizzata come segue: Catalogo Yandex Cultura e arte Musica Canzone d'autore.

Questo metodo di ricerca è abbastanza veloce ed efficace. Alla fine ti vengono offerti solo 5 collegamenti, tra i quali ci sono collegamenti a siti con canzoni di bardi famosi. Non resta che trovare l'archivio con i testi delle canzoni di B. Okudzhava sul sito e selezionare da esso il testo desiderato.

Un altro esempio. Supponiamo che intendi acquistare un telefono cellulare e desideri confrontare le caratteristiche dei dispositivi di diverse aziende. La ricerca può essere condotta secondo le seguenti voci di catalogo: Catalogo Yandex Computer e comunicazioni Comunicazioni mobili Telefoni cellulari.

Avendo ricevuto un numero limitato di collegamenti, è possibile visualizzarli rapidamente e selezionare un telefono esaminando le caratteristiche delle aziende e le modifiche dei dispositivi.

Cerca per parole chiave

La maggior parte dei motori di ricerca ha la possibilità di effettuare ricerche per parola chiave. Questo è uno dei tipi di ricerca più comuni. Per eseguire la ricerca tramite parole chiave è necessario inserire la parola o più parole che si desidera cercare in un'apposita finestra e fare clic sul pulsante Cerca. Il motore di ricerca troverà e visualizzerà i documenti contenenti queste parole nel suo database. Potrebbero esserci molti di questi documenti, ma molti sono presenti in questo caso non significa necessariamente buono.

Conduciamo diversi esperimenti con uno qualsiasi dei motori di ricerca. Ipotizziamo di decidere di avviare un acquario e di essere interessati a qualsiasi informazione su questo argomento.

A prima vista, la cosa più semplice è cercare la parola “acquario”. Controlliamo questo, ad esempio, nel motore di ricerca Yandex. Il risultato della ricerca sarà di oltre 460.000 pagine su 3.500 siti: un numero enorme di collegamenti. Inoltre, se guardi più da vicino, tra questi ci saranno siti che menzionano il gruppo "Aquarium" di B. Grebenshchikov. centri commerciali e associazioni informali con lo stesso nome, e molto altro che non ha nulla a che vedere con i pesci d'acquario.

Non è difficile intuire che una ricerca del genere non potrà soddisfare nemmeno l'utente più modesto. Troppo tempo dovrà essere dedicato alla selezione tra tutti i documenti proposti quelli che riguardano l'argomento di cui abbiamo bisogno, e ancor di più alla conoscenza dei loro contenuti.

Possiamo immediatamente concludere che la ricerca per una parola è solitamente poco pratica, perché utilizzando una parola è molto difficile determinare l'argomento a cui è dedicato un documento, una pagina web o un sito. L'eccezione sono le parole e i termini rari che non vengono quasi mai utilizzati al di fuori della loro area tematica.

Proviamo a chiarire le condizioni di ricerca e inseriamo la frase “pesci d'acquario”. Il risultato della ricerca sarà poco più di 20.000 pagine e circa 650 siti. Come puoi vedere, il numero di collegamenti è diminuito di oltre 20 volte. Questo risultato ci si addice di più, ma tra i link proposti potrebbero esserci, ad esempio, set di souvenir russi con etichette di fiammiferi con immagini di pesci, raccolte di salvaschermi per il desktop del computer e cataloghi di pesci d'acquario con fotografie e accessori per acquari. negozi.

E' ovvio che dovremmo continuare a muoverci verso il chiarimento delle condizioni di ricerca.

Per rendere la ricerca più produttiva, tutti i motori di ricerca dispongono di uno speciale linguaggio di query con una propria sintassi. Queste lingue sono simili in molti modi. È abbastanza difficile studiarli tutti, ma qualsiasi motore di ricerca lo fa sistema di aiuto, che ti permetterà di padroneggiare la lingua desiderata.

Diamo dieci regole semplici formando una query nel motore di ricerca Yandex.

1. Le parole chiave nella query devono essere scritte in lettere minuscole (piccole). Ciò garantirà che vengano cercate tutte le parole chiave, non solo quelle che iniziano con una lettera maiuscola.

2. Durante la ricerca, tutte le forme della parola vengono prese in considerazione secondo le regole della lingua russa, indipendentemente dalla forma della parola nella query. Ad esempio, se nella query è stata specificata la parola "conosci", anche le parole "noi sappiamo", "tu sai" ecc. soddisferanno la condizione di ricerca.

3. Per cercare frase stabile Dovresti mettere le parole tra virgolette, ad esempio "Cina".

4. Per effettuare la ricerca in base alla forma esatta della parola, è necessario anteporre la parola punto esclamativo. Ad esempio, per cercare la parola “settembre” al genitivo, dovresti scrivere “!settembre”. 

5. Per effettuare la ricerca all'interno di una singola frase, le parole nella query sono separate da uno spazio o dal segno &: “romanzo d'avventura” o “romanzo&avventura”. Più parole digitate in una query, separate da spazi, significano che devono essere incluse tutte in una frase del documento da cercare.

6. Se desideri che vengano selezionati solo i documenti che contengono ciascuna parola specificata nella query, metti un segno più "+" davanti a ciascuno di essi. Se, al contrario, vuoi escludere qualche parola dal risultato della ricerca, metti un segno meno “-” davanti a questa parola. I segni “+” e “-” devono essere scritti separati da uno spazio dal precedente e insieme alla parola successiva. Ad esempio, la query “Volga-car” troverà documenti che contengono la parola “Volga” e non la parola “car”.

7. Quando cerchi sinonimi o parole con significati simili, puoi inserire una barra verticale “|” tra le parole. Ad esempio, per la query “bambino | bambino | baby" verranno trovati documenti con una qualsiasi di queste parole.

8. Invece di una parola in una query, puoi sostituire un'intera espressione. Per fare ciò, deve essere messo tra parentesi, ad esempio "(bambino | bambino | bambini | bambino) + (cura | educazione)."

9. Il segno *~" (tilde) consente di trovare documenti la cui frase contiene la prima parola, ma non la seconda. Ad esempio, la query "libri ~ negozio" troverà tutti i documenti contenenti la parola "libri", accanto alla quale (all'interno della frase) non c'è la parola "negozio".

10. Se l'operatore viene ripetuto una volta (ad esempio, & o ~), la ricerca viene eseguita all'interno della frase. Il doppio operatore (&&, -) specifica una ricerca all'interno di un documento. Ad esempio, la query "cancro - astrologia" troverà documenti con la parola "cancro" che non sono correlati all'astrologia.

Avendo un certo insieme di termini più comuni nell'area desiderata, puoi utilizzare la ricerca avanzata. Nella fig. La Figura 3.3 mostra la finestra di ricerca avanzata nel motore di ricerca Yandex. In questa modalità, le funzionalità del linguaggio di query vengono implementate sotto forma di modulo. Un servizio simile, compresi i filtri del dizionario, è offerto da quasi tutti i motori di ricerca.

Riso. 3.3. Un esempio di ricerca avanzata nel sistema Yandex

Detto questo la scelta giusta di parole desiderabili e richieste ed escludendo termini indesiderati, tale ricerca può dare buoni risultati.

Torniamo all'esempio con i pesci d'acquario. Dopo aver letto diversi documenti offerti dal motore di ricerca, diventa chiaro che la ricerca di informazioni su Internet non dovrebbe iniziare con la scelta dei pesci d'acquario. Un acquario è un sistema biologico complesso, la cui creazione e manutenzione richiedono conoscenze speciali, tempo e investimenti seri.

Sulla base delle informazioni ricevute, una persona che effettua una ricerca su Internet può cambiare radicalmente la strategia per ulteriori ricerche decidendo di studiare letteratura speciale legati alla questione oggetto di studio.

Per cercare letteratura o documenti full-text è possibile la seguente interrogazione:

“+(acquario | acquariofilo | acquariofilia) + per principianti + (consigli | letteratura) + (articolo | tesi | testo completo) - (prezzo | negozio | consegna | catalogo).”

Dopo aver elaborato la richiesta da parte del motore di ricerca, è stato ottenuto il seguente risultato: pagine - 195, siti - almeno 43.

Come si può vedere dalle statistiche di ricerca, il risultato ha avuto molto successo. Già i primi link portano ai documenti richiesti:

Posizionamento di un acquario > Consigli per l'acquariofilo principiante >
Articoli > Acquascope. ru
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - rispetto rigoroso.
CONSIGLI PER ACQUARIUMISTI PRINCIPIANTI. Come scegliere e installare un acquario, come...
http://www.aquariums.ru/sovna.htm (2KB) 23/07/2002 - conformità non rigorosa.

Ora puoi riassumere i risultati della ricerca, trarre alcune conclusioni e prendere una decisione azioni possibili:

♦ Interrompi ulteriori ricerche, poiché per vari motivi non sei in grado di mantenere un acquario.
♦ Leggi gli articoli suggeriti e inizia ad allestire un acquario.
♦ Cerca materiali su criceti o pappagallini.

Ricerca professionale

I ricercatori e gli specialisti dovranno adottare un approccio più ponderato nell’organizzare la ricerca. Per la ricerca professionale di informazioni su Internet è necessario soddisfare i seguenti requisiti:

♦ elevata velocità di ricerca;
♦ attendibilità delle informazioni ricevute;
♦ copertura completa delle risorse durante la ricerca.

Velocità. La velocità di ricerca dipende principalmente da due fattori: pianificazione competente della ricerca (selezione di servizi e strumenti di ricerca) e capacità di lavorare con una risorsa già selezionata (capacità di comprenderne rapidamente la struttura e i metodi di navigazione). Gli indici di ricerca non sono sufficienti per garantire la velocità di ricerca. Oltre a questi, su Internet sono disponibili numerose risorse di ricerca, il cui utilizzo garantisce una ricerca professionale.

Credibilità. La questione dell'affidabilità delle informazioni ricevute da Internet è molto rilevante, poiché chiunque può pubblicare lì qualsiasi informazione senza alcun controllo sulla sua conformità alla realtà. Ciò, a sua volta, porta a un gran numero di fonti inaffidabili, come, ad esempio, abstract e tesine, ha inondato Internet.

Esistono servizi di ricerca speciali che consentono di valutare l'affidabilità di una fonte di informazioni su Internet.

Completezza. Una condizione necessaria per una raccolta di informazioni su vasta scala di successo è la conoscenza dei principali tipi di risorse esistenti oggi e l'uso di vari servizi di ricerca. Nessun motore di ricerca può coprire tutte le risorse Internet.

Di norma, per ottenere un risultato positivo, l'utente deve ricorrere ai servizi di diversi motori di ricerca. Puoi farlo tu stesso, spostandoti da un sistema all'altro, oppure puoi affidare questo lavoro a uno dei motori di metaricerca (meta è il primo componente parole difficili, che denota sistemi per descrivere e studiare altri sistemi).

Riso. 3.4. Finestre dei motori di metaricerca

I motori di metaricerca non dispongono di propri database di ricerca e utilizzano le risorse di molti altri motori di ricerca durante la ricerca. Per questo motivo, la probabilità di trovare le informazioni necessarie è molto alta. Il lavoro nei sistemi di metaricerca viene svolto secondo le stesse regole del lavoro nei motori di ricerca. Ciò è dovuto al fatto che i motori di metaricerca sono una sorta di componente aggiuntivo dei motori di ricerca e utilizzano i loro database di indice nel loro lavoro. L'aspetto dei motori di metaricerca assomiglia aspetto famosi motori di ricerca. Nella fig. 3.4 mostra le finestre dei motori di metaricerca myweb.ru e metabot.ru.

L'esperienza dimostra che nella maggior parte dei casi si ottengono risultati migliori utilizzando diversi indici di ricerca indipendenti piuttosto che utilizzando un unico metamotore.

Prova domande e compiti

1. Qual è lo scopo di un programma browser?

2. Quali programmi browser conosci?

3. Dove può trovare gli URL chi effettua una ricerca sul Web?

4. Qual è la tecnologia per effettuare ricerche utilizzando la rubricatrice del motore di ricerca?

5. Qual è la tecnologia per la ricerca per parole chiave?

6. Quali requisiti devono essere soddisfatti per la ricerca professionale di informazioni su Internet?

7. Quando devono essere specificati i segni “+” o “-” nei criteri di ricerca?

8. Quali criteri di ricerca in Yandex sono specificati dalla seguente frase:

(tata | insegnante | governante) ++ (cura | educazione | supervisione).

9. Cosa significa raddoppiare il segno (∼∼ o ++) quando si forma una query complessa?

10. Cos'è la pertinenza della ricerca?

11. Qual è lo scopo dei metamotori?

Strumenti di ricerca

Gli strumenti di ricerca sono software speciali il cui scopo principale è fornire agli utenti di Internet la ricerca di informazioni più ottimale e di alta qualità. Gli strumenti di ricerca sono ospitati su server Web speciali, ognuno dei quali esegue funzione specifica:

1. Analisi delle pagine Web e inserimento dei risultati dell'analisi nell'uno o nell'altro livello del database del server di ricerca.

2. Ricerca di informazioni in base alla richiesta dell'utente.

3. Fornire una comoda interfaccia per la ricerca di informazioni e la visualizzazione dei risultati della ricerca da parte dell'utente.

Le tecniche di lavoro utilizzate quando si lavora con l'uno o l'altro strumento di ricerca sono quasi le stesse. Prima di discuterli, consideriamo i seguenti concetti:

1. L'interfaccia dello strumento di ricerca si presenta sotto forma di una pagina con collegamenti ipertestuali, una riga di query (riga di ricerca) e strumenti di attivazione delle query.

2. L'indice di un motore di ricerca è una base informativa contenente il risultato di un'analisi di pagine web, compilata secondo determinate regole.

3. Una query è una parola chiave o una frase che l'utente inserisce nella barra di ricerca. Per formare varie query, vengono utilizzati caratteri speciali ("", ~) e simboli matematici (*, +, ?).

Lo schema di ricerca delle informazioni è semplice. L'utente digita una frase chiave e attiva la ricerca, ricevendo così una selezione di documenti in base alla richiesta formulata (specificata). Questo elenco di documenti è classificato in base a determinati criteri in modo che in cima all'elenco ci siano quei documenti che corrispondono maggiormente alla richiesta dell'utente. Ciascuno degli strumenti di ricerca utilizza criteri diversi per classificare i documenti, sia durante l'analisi dei risultati della ricerca sia durante la creazione di un indice (popolazione di un database indice di pagine web).

Pertanto, se specifichi una query nella barra di ricerca per ciascuno strumento di ricerca con lo stesso design, puoi ottenere risultati diversi ricerca. Per l’utente è di grande importanza quali documenti appariranno nelle prime due o tre dozzine di documenti nei risultati di ricerca e quanto questi documenti corrispondano alle aspettative dell’utente.

La maggior parte degli strumenti di ricerca offre due metodi di ricerca − ricerca semplice(ricerca semplice) e ricerca avanzata(ricerca avanzata) con o senza apposito modulo di richiesta. Consideriamo entrambi i tipi di ricerca utilizzando l'esempio di un motore di ricerca in lingua inglese.

Ad esempio, AltaVista è utile per query arbitrarie, "Qualcosa sui titoli di studio online in informatica", mentre lo strumento di ricerca di Yahoo ti consente di ottenere notizie dal mondo, informazioni sui tassi di cambio o previsioni meteorologiche.

Padroneggiare i criteri di perfezionamento delle query e le tecniche di ricerca avanzate consente di aumentare l'efficienza della ricerca e trovare rapidamente le informazioni necessarie. Prima di tutto, puoi aumentare l'efficienza della tua ricerca utilizzando operatori logici (operazioni) Oppure, E, Vicino, Not, simboli matematici e speciali nelle tue query. Utilizzando operatori e/o simboli, l'utente associa le parole chiave nella sequenza richiesta per ottenere il risultato di ricerca più appropriato alla query. I moduli di richiesta sono mostrati nella Tabella 1.

Tabella 1

Una semplice richiesta fornisce un certo numero di collegamenti a documenti, perché... nell'elenco sono compresi i documenti contenenti una delle parole inserite in fase di richiesta, oppure una semplice frase (vedi Tabella 1). L'operatore e consente di specificare che tutte le parole chiave devono essere incluse nel contenuto del documento. Tuttavia, il numero di documenti potrebbe essere ancora elevato e la loro revisione richiederà parecchio tempo. Pertanto, in alcuni casi è molto più conveniente utilizzare l'operatore di contesto vicino, che indica che le parole dovrebbero trovarsi sufficientemente vicine nel documento. L'utilizzo di Near riduce significativamente il numero di documenti trovati. La presenza del carattere "*" nella stringa di query significa che la parola verrà cercata tramite la sua maschera. Ad esempio, otterremo un elenco di documenti contenenti parole che iniziano con "gov" se scriviamo "gov*" nella stringa di query. Potrebbero essere le parole governo, governatore, ecc.

Il servizio di ricerca più sviluppato per informazioni in lingua russa è fornito dal server di ricerca Yandex. In Yandex puoi semplicemente scrivere una frase in russo che descriva ciò che desideri trovare e il sistema analizzerà ed elaborerà la tua richiesta, quindi proverà a trovare tutto ciò che riguarda l'argomento specificato. Utilizzando operatori speciali, puoi creare una stringa che spiega al motore di ricerca quali dovrebbero essere i tuoi requisiti per l'informazione che ti interessa.

Il non meno popolare motore di ricerca Rambler conserva le statistiche sul traffico dei collegamenti dal proprio database gli stessi operatori logici AND, OR, NOT, il metasimbolo * (simile al carattere * in AltaVista che espande l'intervallo di query), i simboli dei coefficienti + e -; sono supportati per aumentare o diminuire le parole di significato immesse nella richiesta.

Diamo un'occhiata alle tecnologie più popolari per la ricerca di informazioni su Internet.

1. Introduzione

Ogni anno il volume di Internet aumenta in modo significativo, quindi la probabilità di trovare le informazioni necessarie aumenta notevolmente. Internet collega milioni di computer, molte reti diverse e il numero di utenti aumenta del 15-80% ogni anno. Eppure, sempre più spesso, quando si accede a Internet, il problema principale non è la mancanza delle informazioni che si cercano, ma la capacità di trovarle. Di norma, una persona comune, a causa di varie circostanze, non può o non vuole dedicare più di 15-20 minuti alla ricerca della risposta di cui ha bisogno. Pertanto, è particolarmente importante imparare correttamente e con competenza una cosa apparentemente semplice: dove e come cercare per ottenere le risposte DESIDERATE.

Per trovare le informazioni di cui hai bisogno, devi trovare il suo indirizzo. A questo scopo esistono server di ricerca specializzati (robot di indicizzazione (motori di ricerca), elenchi Internet tematici, sistemi di metaricerca, servizi di ricerca di persone, ecc.). Questa master class rivela le tecnologie di base per la ricerca di informazioni su Internet, fornisce le caratteristiche generali degli strumenti di ricerca ed esamina le strutture delle query di ricerca per i più popolari motori di ricerca in lingua russa e inglese.

2. Tecnologie di ricerca

Tecnologia web Il World Wide Web (WWW) è considerato una tecnologia speciale per la preparazione e la pubblicazione di documenti su Internet. Il WWW comprende sia pagine web che biblioteche digitali, cataloghi e persino musei virtuali! Con una tale abbondanza di informazioni, sorge la domanda: "Come navigare in uno spazio informativo così vasto e su larga scala?"
Gli strumenti di ricerca vengono in soccorso per risolvere questo problema.

2.1 Strumenti di ricerca

Gli strumenti di ricerca sono software speciali il cui scopo principale è fornire agli utenti di Internet la ricerca di informazioni più ottimale e di alta qualità. Gli strumenti di ricerca sono ospitati su speciali server web, ognuno dei quali svolge una funzione specifica:

  1. Analisi delle pagine Web e registrazione dei risultati dell'analisi all'uno o all'altro livello del database del server di ricerca.
  2. Ricerca di informazioni in base alla richiesta dell'utente.
  3. Fornire una comoda interfaccia per la ricerca di informazioni e la visualizzazione dei risultati della ricerca da parte dell'utente.

Le tecniche di lavoro utilizzate quando si lavora con l'uno o l'altro strumento di ricerca sono quasi le stesse. Prima di discuterli, consideriamo i seguenti concetti:

  1. L'interfaccia dello strumento di ricerca si presenta sotto forma di una pagina con collegamenti ipertestuali, una riga di query (riga di ricerca) e strumenti di attivazione delle query.
  2. L'indice di un motore di ricerca è una base informativa contenente il risultato di un'analisi di pagine web, compilata secondo determinate regole.
  3. Una query è una parola chiave o una frase che un utente inserisce nella barra di ricerca. Per formare varie query, vengono utilizzati caratteri speciali ("", ~) e simboli matematici (*, +, ?).

Lo schema per la ricerca di informazioni su Internet è semplice. L'utente digita una frase chiave e attiva la ricerca, ricevendo così una selezione di documenti in base alla richiesta formulata (specificata). Questo elenco di documenti è classificato in base a determinati criteri in modo che in cima all'elenco ci siano quei documenti che corrispondono maggiormente alla richiesta dell'utente. Ciascuno degli strumenti di ricerca utilizza criteri diversi per classificare i documenti, sia durante l'analisi dei risultati della ricerca sia durante la creazione di un indice (popolazione di un database indice di pagine web).

Pertanto, se specifichi una query con lo stesso design nella barra di ricerca per ciascuno strumento di ricerca, puoi ottenere risultati di ricerca diversi. Per l’utente è di grande importanza quali documenti appariranno nelle prime due o tre dozzine di documenti nei risultati di ricerca e quanto questi documenti corrispondano alle aspettative dell’utente.

La maggior parte degli strumenti di ricerca offre due metodi di ricerca − ricerca semplice(ricerca semplice) e ricerca avanzata(ricerca avanzata) con o senza apposito modulo di richiesta. Consideriamo entrambi i tipi di ricerca utilizzando l'esempio di un motore di ricerca in lingua inglese.

Ad esempio, AltaVista è utile per query arbitrarie, "Qualcosa sui titoli di studio online in informatica", mentre lo strumento di ricerca di Yahoo ti consente di ottenere notizie dal mondo, informazioni sui tassi di cambio o previsioni meteorologiche.

Padroneggiare i criteri di perfezionamento delle query e le tecniche di ricerca avanzate consente di aumentare l'efficienza della ricerca e trovare rapidamente le informazioni necessarie. Prima di tutto, puoi aumentare l'efficienza della tua ricerca utilizzando operatori logici (operazioni) Oppure, E, Vicino, Not, simboli matematici e speciali nelle tue query. Utilizzando operatori e/o simboli, l'utente associa le parole chiave nella sequenza richiesta per ottenere il risultato di ricerca più appropriato alla query. I moduli di richiesta sono mostrati nella Tabella 1.

Tabella 1

Una semplice richiesta fornisce un certo numero di collegamenti a documenti, perché... nell'elenco sono compresi i documenti contenenti una delle parole inserite in fase di richiesta, oppure una semplice frase (vedi Tabella 1). L'operatore e consente di specificare che tutte le parole chiave devono essere incluse nel contenuto del documento. Tuttavia, il numero di documenti potrebbe essere ancora elevato e la loro revisione richiederà parecchio tempo. Pertanto, in alcuni casi è molto più conveniente utilizzare l'operatore di contesto vicino, che indica che le parole dovrebbero trovarsi sufficientemente vicine nel documento. L'utilizzo di Near riduce significativamente il numero di documenti trovati. La presenza del carattere "*" nella stringa di query significa che la parola verrà cercata tramite la sua maschera. Ad esempio, otterremo un elenco di documenti contenenti parole che iniziano con "gov" se scriviamo "gov*" nella stringa di query. Potrebbero essere le parole governo, governatore, ecc.

Il non meno popolare motore di ricerca Rambler conserva le statistiche sul traffico dei collegamenti dal proprio database gli stessi operatori logici AND, OR, NOT, il metasimbolo * (simile al carattere * in AltaVista che espande l'intervallo di query), i simboli dei coefficienti + e -; sono supportati per aumentare o diminuire le parole di significato immesse nella richiesta.

Diamo un'occhiata alle tecnologie più popolari per la ricerca di informazioni su Internet.

2.2 Motori di ricerca

I motori di ricerca Web sono server con un enorme database di URL che accedono automaticamente alle pagine WWW a tutti questi indirizzi, esaminano il contenuto di queste pagine, formano e scrivono parole chiave dalle pagine nel loro database (indicizzano le pagine).

Inoltre, i robot dei motori di ricerca seguono i collegamenti trovati nelle pagine e li reindicizzano. Poiché quasi tutte le pagine WWW hanno molti collegamenti ad altre pagine, con tale lavoro un motore di ricerca può teoricamente eseguire la scansione di tutti i siti su Internet come risultato finale.

Questo tipo di strumenti di ricerca è il più famoso e popolare tra tutti gli utenti di Internet. Tutti hanno sentito i nomi di noti motori di ricerca web (motori di ricerca): Yandex, Rambler, Aport.

Per utilizzare questo tipo di strumento di ricerca, devi accedervi e digitare la parola chiave che ti interessa nella barra di ricerca. Successivamente, riceverai i risultati dai collegamenti memorizzati nel database del motore di ricerca più vicini alla tua richiesta. Per rendere la tua ricerca più efficace, presta attenzione in anticipo ai seguenti punti:

  • decidere l'oggetto della richiesta. Cosa vuoi trovare esattamente alla fine?
  • prestare attenzione alla lingua, alla grammatica, all'uso di vari simboli non letterali, alla morfologia. È anche importante formulare e inserire correttamente le parole chiave. Ogni motore di ricerca ha la propria forma di costruzione delle query: il principio è lo stesso, ma i simboli o gli operatori utilizzati possono differire. I moduli di richiesta richiesti variano anche a seconda della complessità del software del motore di ricerca e dei servizi forniti. In un modo o nell'altro, ogni motore di ricerca ha una sezione "Aiuto", in cui tutte le regole di sintassi, nonché i consigli e i suggerimenti per la ricerca, sono chiaramente spiegati (screenshot delle pagine del motore di ricerca).
  • utilizzare le funzionalità di diversi motori di ricerca. Se non lo trovi su Yandex, prova su Google. Utilizza servizi di ricerca avanzati.
  • Per escludere documenti contenenti determinati termini, utilizzare un segno "-" prima di ciascuna di tali parole. Ad esempio, se hai bisogno di informazioni sulle opere di Shakespeare, ad eccezione di "Amleto", inserisci la query nel modulo: "Shakespeare-Amleto". E per garantire che determinati collegamenti siano inclusi nei risultati della ricerca, utilizza il simbolo “+”. Pertanto, per trovare collegamenti specifici sulla vendita di automobili, è necessaria la query "vendita + auto". Per aumentare l'efficienza e la precisione della tua ricerca, utilizza combinazioni di questi simboli.
  • Ogni collegamento nell'elenco dei risultati della ricerca contiene diverse righe del documento trovato, tra le quali compaiono le tue parole chiave. Prima di cliccare sul link, valuta la pertinenza dello snippet rispetto all'argomento della richiesta. Dopo aver seguito un collegamento a un sito specifico, guarda attentamente la pagina principale. Di norma, la prima pagina è sufficiente per capire se sei arrivato all'indirizzo giusto oppure no. Se sì, esegui ulteriori ricerche per le informazioni necessarie sul sito selezionato (nelle sezioni del sito, in caso contrario, torna ai risultati della ricerca e prova il collegamento successivo);
  • Ricorda che i motori di ricerca non producono informazioni proprie (ad eccezione delle spiegazioni su se stessi). Un motore di ricerca è solo un intermediario tra il proprietario delle informazioni (sito) e te. I database vengono costantemente aggiornati, vengono aggiunti nuovi indirizzi, ma rimane ancora il ritardo rispetto alle informazioni effettivamente esistenti nel mondo. Semplicemente perché i motori di ricerca non funzionano alla velocità della luce.

I motori di ricerca web più famosi includono Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Tra quelli di lingua russa si possono evidenziare Yandex, Rambler, Aport.

I motori di ricerca sono i più grandi e preziosi, ma non sono le uniche fonti di informazioni su Internet, perché oltre a loro ci sono altri modi per effettuare ricerche in Internet.

2.3 Directory

Il catalogo delle risorse Internet è un catalogo gerarchico costantemente aggiornato e in espansione contenente molte categorie e singoli server Web con una breve descrizione dei loro contenuti. Il metodo di ricerca del catalogo prevede lo "scendere per gradi", ovvero il passaggio da categorie più generali a altre quelli specifici. Uno dei vantaggi delle directory tematiche è che le spiegazioni dei collegamenti sono fornite dai creatori della directory e ne riflettono pienamente il contenuto, cioè ti dà l'opportunità di determinare con maggiore precisione quanto il contenuto del server corrisponde a quello scopo della tua ricerca

Un esempio di catalogo tematico in lingua russa è la risorsa http://www.ulitka.ru/.

Nella pagina principale di questo sito è presente una rubrica tematica,

con l'aiuto del quale l'utente si ritrova in una sezione con collegamenti a prodotti di suo interesse.

Inoltre, alcune directory tematiche ti consentono di effettuare ricerche per parole chiave. L'utente inserisce la parola chiave desiderata nella barra di ricerca

e riceve un elenco di collegamenti con le descrizioni dei siti che più si avvicinano alla sua richiesta. È interessante notare che questa ricerca non avviene nei contenuti dei server WWW, ma nelle loro brevi descrizioni archiviate nella directory.

Nel nostro esempio, il catalogo ha anche la possibilità di ordinare i siti per numero di visite, in ordine alfabetico e per data di inserimento.

Altri esempi di directory in lingua russa:
[email protected]
Elenco web
Vsego.ru
Tra i cataloghi in lingua inglese possiamo evidenziare:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Collegare raccolte

Le raccolte di collegamenti sono collegamenti ordinati per argomento. Sono abbastanza diversi l'uno dall'altro nel contenuto, quindi per trovare la selezione che meglio si adatta ai tuoi interessi, devi esaminarli tu stesso per formarti la tua opinione.

Ad esempio, prendiamo una selezione di link "Tesori Internet" di JSC "Relcom"

L'utente fa clic su una qualsiasi delle sezioni che lo interessano

  • CONTENUTO

    Gli automobilisti

    • Astronomia e astrologia
    • La tua casa
    • I tuoi animali domestici
    • I bambini sono i fiori della vita
    • Tempo libero
    • Città su Internet
    • Salute e medicina
    • Agenzie e servizi di stampa
    • Museo di storia locale, ecc.,
    • Elettronica automobilistica.
    • Museo dell'Automoto Antica.
    • Collegio Tutela legale Proprietari di auto.
    • Guida sportiva.

    Il vantaggio di questo tipo di strumenti di ricerca è il loro focus; di solito la selezione include rare risorse Internet selezionate da un webmaster specifico o dal proprietario di una pagina Internet.

    2.5 Banca dati degli indirizzi

    I database di indirizzi sono server di ricerca speciali che solitamente utilizzano classificazioni per tipo di attività, per prodotti e servizi forniti e per area geografica. A volte sono integrati con la ricerca alfabetica. I record del database memorizzano informazioni sui siti che forniscono informazioni su indirizzo email, organizzazione e indirizzo postale a pagamento.

    Il più grande database di indirizzi in lingua inglese è: http://www.lookup.com/ -

    Una volta in queste sottodirectory, l'utente trova collegamenti a siti che offrono informazioni di suo interesse.

    Non conosciamo banche dati ufficiali e ampiamente accessibili di indirizzi nella Federazione Russa.

    2.6 Ricerca negli archivi Gopher

    Gopher è un sistema interconnesso di server (spazio Gopher) distribuito su Internet.

    Lo spazio Gopher contiene una ricca biblioteca letteraria, ma i materiali non sono consultabili da remoto: l'utente può solo visualizzare un sommario organizzato gerarchicamente e selezionare un file per nome. Utilizzando un programma speciale (Veronica), tale ricerca può essere eseguita automaticamente, utilizzando query basate su parole chiave.

    Fino al 1995 Gopher era la tecnologia Internet più dinamica: il tasso di crescita del numero dei server corrispondenti superava il tasso di crescita dei server di tutti gli altri tipi di Internet. I server Gopher non hanno ricevuto uno sviluppo attivo nella rete EUnet/Relcom e oggi quasi nessuno se ne ricorda.

    2.7 Sistema di ricerca FTP

    Un cercatore di file FTP è un tipo speciale di strumento di ricerca su Internet che consente di trovare file disponibili su server FTP "anonimi". Il protocollo FTP è progettato per trasferire file sulla rete e in questo senso è funzionalmente una sorta di analogo di Gopher.

    Il criterio di ricerca principale è il nome file specificato in modi diversi(corrispondenza esatta, sottostringa, espressione regolare, ecc.). Questo tipo di ricerca, ovviamente, non può competere in termini di capacità con i motori di ricerca, poiché il contenuto dei file non viene preso in considerazione durante la ricerca e, come sapete, ai file possono essere assegnati nomi arbitrari. Tuttavia, se hai bisogno di trovare un programma noto o una descrizione standard, molto probabilmente il file che lo contiene avrà il nome appropriato e potrai trovarlo utilizzando uno dei server di ricerca FTP:

    FileSearch cerca file su server FTP in base ai nomi dei file e delle directory stessi. Se stai cercando qualche programma o qualcos'altro, molto probabilmente troverai la loro descrizione sui server WWW e dai server FTP potrai scaricarli su te stesso.

    2.8 Sistema di ricerca in Usenet Conferenze stampa

    USENET NEWS è un sistema di teleconferenza per la comunità Internet. In Occidente, questo servizio è solitamente chiamato notizie. Uno stretto analogo delle teleconferenze sono i cosiddetti "echi" nella rete FIDO.

    Dal punto di vista di un abbonato a un newsgroup, USENET è una bacheca con sezioni in cui puoi trovare articoli su tutto, dalla politica al giardinaggio. Questa bacheca è accessibile tramite computer, simile alla posta elettronica. Senza lasciare il computer, puoi leggere o pubblicare articoli in una particolare conferenza, trovare consiglio utile o impegnarsi in discussioni. Naturalmente gli articoli occupano spazio sui computer, quindi non vengono archiviati per sempre, ma vengono periodicamente distrutti per fare spazio a nuovi. In tutto il mondo, il miglior servizio per la ricerca di informazioni nelle conferenze Usenet è il server di Google Groups (Google Inc.).

    Google Gruppi è una comunità online gratuita e un servizio di gruppi di discussione che offre il più grande archivio di messaggi Usenet di Internet (oltre un miliardo di messaggi). Per ulteriori informazioni sui termini di utilizzo del servizio, visitare http://groups.google.com/intl/. it /googlegroups/tour/index.html

    Tra quelli di lingua russa spiccano il server USENET World System e le teleconferenze Relcom. Proprio come in altri servizi di ricerca, l'utente digita una stringa di query e il server genera un elenco di conferenze contenenti parole chiave. Successivamente, è necessario iscriversi alle conferenze selezionate nel programma di notizie. Esiste anche un server russo simile FidoNet Online: conferenze Fido su WWW.

    2.9 Metamotori di ricerca

    Per cercare rapidamente nei database di più motori di ricerca contemporaneamente, è meglio rivolgersi ai sistemi di metaricerca.

    I metamotori di ricerca sono motori di ricerca che inviano la tua richiesta a un numero enorme di motori di ricerca diversi, quindi elaborano i risultati, rimuovono gli indirizzi di risorse duplicati e presentano una gamma più ampia di ciò che viene presentato su Internet.

    Il metamotore di ricerca più popolare al mondo è Search.com.

    Il motore di ricerca unificato di CNET, Inc. Search.com include quasi due dozzine di motori di ricerca, i cui collegamenti sono pieni di collegamenti in tutta Internet.

    Utilizzando questo tipo di strumenti di ricerca, l'utente può tuttavia cercare informazioni in una varietà di motori di ricerca lato negativo Questi sistemi possono essere definiti la loro instabilità.

    2.10 Sistemi di ricerca delle persone

    I sistemi di ricerca delle persone sono server speciali che consentono di cercare persone su Internet, l'utente può specificare il loro nome completo; persona e ottenere il suo indirizzo e-mail e URL. Va tuttavia notato che i motori di ricerca ottengono informazioni sugli indirizzi e-mail principalmente da fonti pubbliche come i forum Usenet. Tra i sistemi di ricerca delle persone più famosi ci sono:

    Cerca indirizzi email

    In apposite colonne di ricerca con le informazioni di contatto (Nome. Città, Cognome, Numero di telefono), puoi trovare le informazioni che ti interessano.

    I sistemi di ricerca delle persone sono server davvero grandi; i loro database contengono circa 6.000.000 di indirizzi.

    3. Conclusione

    Abbiamo esaminato le principali tecnologie per la ricerca di informazioni su Internet e delineato gli strumenti di ricerca esistenti su Internet. al momento su Internet, nonché la struttura delle query di ricerca per i più popolari motori di ricerca in lingua russa e inglese e, riassumendo quanto sopra, vorremmo notare che non esiste un unico schema ottimale per la ricerca di informazioni su Internet . A seconda delle specifiche delle informazioni di cui hai bisogno, puoi utilizzare gli strumenti e i servizi di ricerca appropriati. E la qualità dei risultati della ricerca dipende da quanto bene vengono selezionati i servizi di ricerca.

  • IRS (sistema di recupero delle informazioni)è un sistema che fornisce la ricerca e la selezione dei dati necessari in un database speciale con descrizioni delle fonti di informazione (indice) in base al linguaggio di recupero delle informazioni e alle corrispondenti regole di ricerca.

    Rilevanza– è la corrispondenza dei risultati della ricerca alla query formulata.

    Pertinenza(nel recupero delle informazioni) - conformità delle informazioni ricevute con le esigenze informative dell'utente.

    La rilevanza è misurata dal grado di corrispondenza tra le aspettative dell'utente e i risultati della ricerca (confronto con pertinenza), che è definita come il rapporto tra la quantità di informazioni utili all'utente e la quantità totale di informazioni recuperate trovate dal motore di ricerca.

    Il raggiungimento di un elevato grado di persistenza è il principale campo di competizione per i moderni motori di ricerca. Per la massima soddisfazione bisogni informativi utenti, le teorie e i metodi delle reti semantiche, l'analisi dei contenuti e l'analisi approfondita dei testi (Text mining, estrazione di testo).

    Per trovare le informazioni necessarie su Internet, utilizzare indirizzo della risorsa (Inglese . UniformeRisorsaLocalizzatore (URL) indirizzo), contenente il nome del protocollo tramite il quale accedere alle informazioni richieste, l'indirizzo del server e il nome del file su questo server (Fig. 2).

    Riso. 2. Esempio di indirizzo di una risorsa

    Motore di ricerca- un complesso software e hardware con un'interfaccia web che offre la possibilità di cercare informazioni su Internet. Per motore di ricerca si intende solitamente un sito web su cui si trova l'interfaccia del sistema. La parte software di un sistema di ricerca è un motore di ricerca (motore di ricerca) - un insieme di programmi che fornisce la funzionalità di un sistema di ricerca e di solito è un segreto commerciale della società sviluppatrice del motore di ricerca

    La ricerca di informazioni su Internet viene effettuata utilizzando programmi speciali che elaborano le richieste - sistemi di recupero delle informazioni (IRS). Esistono diversi modelli su cui si basa il lavoro dei motori di ricerca, ma storicamente due modelli hanno guadagnato la massima popolarità: questo directory di ricerca e indici di ricerca.

    I cataloghi di ricerca sono organizzati secondo lo stesso principio dei cataloghi per soggetto delle grandi biblioteche. Si tratta solitamente di menu ipertestuali gerarchici con voci e sottovoci che definiscono gli argomenti dei siti i cui indirizzi sono contenuti in questa directory, con una chiarificazione graduale dell'argomento di livello in livello. Le directory di ricerca vengono create manualmente. Redattori altamente qualificati esaminano personalmente lo spazio informativo del WWW, selezionano ciò che considerano di interesse pubblico e lo inseriscono nel catalogo.

    Il problema principale delle directory di ricerca è il tasso di copertura estremamente basso delle risorse WWW. Per aumentare in modo significativo il tasso di copertura delle risorse Web, è necessario eliminare il fattore umano dal processo di riempimento del database dei motori di ricerca: il lavoro deve essere automatizzato.

    Viene eseguita la catalogazione automatica delle risorse Web e la soddisfazione delle richieste dei clienti indici di ricerca. Il lavoro dell’indice di ricerca può essere suddiviso in tre fasi:

      raccolta del database primario. Per scansionare lo spazio informativo del WWW, vengono utilizzati programmi agenti speciali: worm, il cui compito è cercare risorse sconosciute e registrarle nel database;

      indicizzazione del database: elaborazione primaria ai fini dell'ottimizzazione della ricerca. Nella fase di indicizzazione vengono creati documenti specializzati: gli indici di ricerca veri e propri;

      perfezionando l'elenco risultante. In questa fase viene creato un elenco di collegamenti che verranno passati di conseguenza all'utente. Perfezionare l'elenco risultante implica filtrare e classificare i risultati della ricerca.

    Filtrare significa filtrare i collegamenti che non sono appropriati da fornire all'utente (ad esempio, controllare la presenza di duplicati). La classifica consiste nel creare un ordine speciale per la presentazione dell'elenco risultante (in base al numero di parole chiave, parole correlate, ecc.).

    Il compito principale di qualsiasi sistema informativo è ricercare informazioni rilevanti per le esigenze informative dell’utente. È molto importante non perdere nulla a seguito della ricerca, cioè trovare tutti i documenti relativi alla richiesta e non trovare nulla di superfluo. Pertanto, viene introdotta una caratteristica qualitativa della procedura di ricerca: la pertinenza.

    Rilevanza– è la corrispondenza dei risultati della ricerca alla query formulata.

    1 Strumenti di ricerca

    Gli strumenti di ricerca sono software speciali il cui scopo principale è fornire agli utenti di Internet la ricerca di informazioni più ottimale e di alta qualità. Gli strumenti di ricerca sono ospitati su speciali server web, ognuno dei quali svolge una funzione specifica:

    I motori di ricerca Web sono server con un enorme database di URL che accedono automaticamente alle pagine WWW a tutti questi indirizzi, esaminano il contenuto di queste pagine, formano e scrivono parole chiave dalle pagine nel loro database (indicizzano le pagine).

    Inoltre, i robot dei motori di ricerca seguono i collegamenti trovati sulle pagine e li reindicizzano. Poiché quasi tutte le pagine WWW hanno molti collegamenti ad altre pagine, con tale lavoro un motore di ricerca può teoricamente eseguire la scansione di tutti i siti su Internet come risultato finale.

    Questo tipo di strumenti di ricerca è il più famoso e popolare tra tutti gli utenti di Internet. Tutti hanno sentito i nomi di noti motori di ricerca web (motori di ricerca): Yandex, Rambler, Aport.

    Il funzionamento dei motori di ricerca web è il seguente:

      Analisi delle pagine Web e registrazione dei risultati dell'analisi all'uno o all'altro livello del database del server di ricerca.

      Ricerca di informazioni in base alla richiesta dell'utente.

      Fornire una comoda interfaccia per la ricerca di informazioni e la visualizzazione dei risultati della ricerca da parte dell'utente.

    Le tecniche di lavoro utilizzate quando si lavora con l'uno o l'altro strumento di ricerca sono quasi le stesse. Nel descriverli, vengono utilizzati i seguenti concetti:

      L'interfaccia dello strumento di ricerca si presenta sotto forma di una pagina con collegamenti ipertestuali, una riga di query (riga di ricerca) e strumenti di attivazione delle query.

      L'indice di un motore di ricerca è una base informativa contenente il risultato di un'analisi di pagine web, compilata secondo determinate regole.

      Una query è una parola chiave o una frase che un utente inserisce nella barra di ricerca. Per formare varie query, vengono utilizzati caratteri speciali ("", ~) e simboli matematici (*, +, ?).

    Lo schema di ricerca delle informazioni è semplice. L'utente digita una frase chiave e attiva la ricerca, ricevendo così una selezione di documenti in base alla richiesta formulata (specificata). Questo elenco di documenti è classificato in base a determinati criteri in modo che in cima all'elenco ci siano quei documenti che corrispondono maggiormente alla richiesta dell'utente. Ciascuno degli strumenti di ricerca utilizza criteri diversi per classificare i documenti, sia durante l'analisi dei risultati della ricerca sia durante la creazione di un indice (popolazione di un database indice di pagine web).

    In Russia, gli indici di ricerca più grandi e popolari sono:

      "Yandex" (www.yandex.ru)

      Rambler (www.rambler.ru)

      "Google" (www.google.ru)

      "Aport2000" (www.aport.ru)

    2 Meccanismi di ricerca

    La tecnologia di ricerca generalizzata è composta dalle seguenti fasi:

      L'utente formula una richiesta

      Il sistema ricerca i documenti (o le relative immagini di ricerca)

      L'utente riceve il risultato (informazioni sui documenti)

      L'utente migliora o riforma la richiesta

      Organizzazione di una nuova ricerca...

    In genere, i motori di ricerca supportano due modalità: modalità di ricerca semplice e modalità di ricerca avanzata. Consideriamo le possibilità generalizzate.

    Formare una richiesta in modalità di ricerca semplice. Puoi semplicemente inserire una o più parole separate da uno spazio; la ricerca di parole con tutte le possibili desinenze è modellata dal simbolo * alla fine della parola. Molti sistemi consentono di cercare frasi o frasi; per fare ciò è necessario racchiuderlo tra virgolette. Potrebbe essere necessario includere o escludere obbligatoriamente alcune parole.

    Il problema principale della ricerca utilizzando una query composta in modo primitivo (sotto forma di elenco di parole chiave) è che il motore di ricerca troverà tutte le pagine in cui compaiono le parole specificate in qualsiasi parte del documento. In genere, il numero di pagine trovate sarà troppo grande.

    Per migliorare la qualità della ricerca nella modalità di ricerca semplice, è consentito utilizzare operatori e operatori logici che consentono di limitare l'area di ricerca, nonché di selezionare una categoria specifica di documenti dall'elenco presentato.

    Molti motori di ricerca includono operatori speciali nel loro linguaggio di query che consentono di cercare in determinate aree di un documento, ad esempio nel titolo, o di cercare un documento tramite una parte nota del suo indirizzo.

    Modalità di query avanzata o dettagliata in diversi sistemi viene implementato individualmente, ma molto spesso è una forma in cui gli operatori e gli elementi chiave menzionati vengono implementati semplicemente selezionando le caselle appropriate o selezionando i parametri da un elenco.

    Di seguito, ad esempio, sono riportate le informazioni della sezione aiuto Motore di ricerca Yandex: finestra di ricerca avanzata, linguaggio di query, ricerca in ciò che è stato trovato.

    Ricerca V trovato Se V risultato della richiesta Yandex trovato molti documenti, ma su un argomento più ampio di quello che desideri, puoi restringere questo elenco specificando la tua query. Un'altra opzione è abilitare la casella di controllo V trovato V modulo di ricerca, imposta parole chiave aggiuntive e la ricerca successiva verrà condotta solo sui documenti selezionati V ricerca precedente.

    Promemoria per l'utilizzo del linguaggio di query

    Esempio

    Senso

    "Vieni da noi per il sottaceto mattutino"

    Le parole si presentano in fila nella forma esatta

    "L'*ambasciatore è arrivato"

    Parola mancante nella citazione

    mezza fetta e mais

    Parole all'interno di una frase

    equipaggiare e ottenere

    Parole all'interno di un documento

    gallo cedrone | pernice | qualcuno

    Cerca una qualsiasi delle parole

    non puoi<< винить

    "e" non classificato: l'espressione dopo l'operatore non influisce sulla posizione del documento nei risultati della ricerca

    Devo eseguire /2

    Distanza tra due parole in qualsiasi direzione (ovvero, una parola può trovarsi tra determinate parole)

    qualcosa che ~~ capisco

    Eliminazione di una parola Capirò dalla ricerca

    con la mia intelligenza /+2

    Distanza entro due parole in ordine diretto

    tè ~ laptem

    Cerca una frase in cui si trova la parola si incontra senza dire una parola scarpe liberiane

    zuppa di cavolo /(-1 +2) bevendo

    Distanza da una parola in ordine inverso a due parole in ordine in avanti

    Capisco cosa!

    Parole nella forma esatta con caso specificato

    risulta && (+ su | !me)

    Le parentesi formano gruppi in query complesse

    Politica

    Forma del dizionario della parola

    titolo:(nel paese)

    Ricerca per titoli di documenti

    url:ptici.narod.ru/ptici/kuropatka.htm

    Cerca per URL

    certamente inurl:vojne

    Ricerca basata sul frammento di URL

    Cerca per host

    Ricerca per host con voce inversa

    sito: http://www.lib.ru/PXESY/FILATOW

    Cerca in tutti i sottodomini e le pagine di un determinato sito

    Cerca per tipo di file

    Ricerca limitata dalla lingua

    Ricerca limitata al dominio

    Cerca con limitazioni di data

    affari statali && /3 prendi il filo

    Distanza 3 frasi in qualsiasi direzione

    qualcosa che ~~ capisco

    Eliminazione di una parola Capirò dalla ricerca

    Un'opzione interessante è cercare documenti sul Web che si collegano a una pagina con un URL specificato. In questo modo è possibile trovare pagine sul Web che contengono collegamenti al proprio sito Web. Alcuni sistemi ti permetteranno di limitare la ricerca all'interno di un dominio specifico.

    Ulteriori operatori speciali includono:

      Operatori per la ricerca di documenti con uno specifico file grafico;

      Operatori che limitano la data delle pagine ricercate;

      Operatori di prossimità tra parole;

      Operatori contabili in formato word;

      Operatori per l'ordinamento dei risultati (per rilevanza, freschezza, vecchiaia).

    Va notato che, purtroppo, oggi non esiste uno standard per il numero e la sintassi degli operatori supportati per i vari motori di ricerca. Sono in corso sforzi per sviluppare uno standard per la sintassi degli operatori supportati, quindi si spera che gli sviluppatori dei motori di ricerca si prendano cura dell'esperienza dell'utente. In questa fase di sviluppo degli strumenti di ricerca, un utente, quando accede a un particolare motore di ricerca, deve prima di tutto familiarizzare con le sue regole per comporre le query. Di norma, ci sarà un collegamento sulla home page Aiuto, che ti porterà alle informazioni di riferimento.

    Diversi motori di ricerca descrivono diversi numeri di fonti di informazione su Internet. Pertanto, non puoi limitare la ricerca a un solo motore di ricerca.

    Consideriamo i modi presentazione dei risultati della ricerca nei motori di ricerca.

    Molto spesso, il numero di documenti trovati supera diverse dozzine e in alcuni casi può raggiungere centinaia di migliaia! Pertanto, come forma di emissione, viene compilato un elenco di documenti di 5-10-15 unità per pagina con la possibilità di passare alla porzione successiva in fondo alla pagina. È necessario indicare il titolo e l'URL (indirizzo) del documento trovato; a volte il sistema indica il grado di pertinenza del documento in percentuale;

    La descrizione di un documento molto spesso contiene le prime frasi o estratti del testo del documento con le parole chiave evidenziate. Di norma, viene indicata la data di aggiornamento (verifica) del documento, la sua dimensione in kilobyte, alcuni sistemi determinano la lingua del documento e la sua codifica (per i documenti in lingua russa);

    Cosa puoi fare con i risultati ottenuti? Se il titolo e la descrizione del documento soddisfano le tue esigenze, puoi andare immediatamente alla fonte originale utilizzando il collegamento. È più conveniente farlo in una nuova finestra per poter analizzare ulteriormente i risultati della ricerca. Molti motori di ricerca ti consentono di cercare i documenti trovati e puoi affinare la tua ricerca introducendo termini aggiuntivi.

    Se l'intelligenza del sistema è elevata, ti potrebbe essere offerto il servizio di ricerca di documenti simili. Per fare ciò, selezioni un documento che ti piace particolarmente e lo indichi al sistema come modello da seguire.

    Tuttavia, automatizzare la determinazione della somiglianza non è un compito banale e spesso questa funzione non funziona come previsto. Alcuni motori di ricerca ti consentono di riordinare i risultati. Per risparmiare tempo, puoi salvare i risultati della ricerca come file sul tuo disco locale per studiarli successivamente offline.