Latest topics
» பல்சுவை கதம்பம்by rammalar Wed 20 Nov 2024 - 17:50
» தெளிவு பெறு ஓம் - ஆன்மீகம்
by rammalar Tue 19 Nov 2024 - 14:22
» பேச்சு சாதூர்யம் உள்ளவர்கள் வாழ்க்கையில் பெரும் வெற்றி பெறுகிறார்கள்.
by rammalar Tue 19 Nov 2024 - 12:18
» அலை பாயுதே
by rammalar Sun 17 Nov 2024 - 18:03
» எனக்கொரு வழியைக் காட்டி விடு!
by rammalar Sun 17 Nov 2024 - 18:02
» முழு நிலவு
by rammalar Sun 17 Nov 2024 - 18:01
» குளம் – புதுக்கவிதை
by rammalar Sun 17 Nov 2024 - 18:00
» அன்னாபிஷேக மகிமை
by rammalar Sun 17 Nov 2024 - 17:59
» அன்னைத் தமிழை மறக்காதே அடையாளத்தை இழக்காதே!
by rammalar Sun 17 Nov 2024 - 17:58
» கல்லறை போனாலும்…
by rammalar Sun 17 Nov 2024 - 17:56
» தெய்வமே வழி காட்ட வா!
by rammalar Sun 17 Nov 2024 - 17:53
» அழைப்பு – கவிதை
by rammalar Sun 17 Nov 2024 - 17:52
» பெற்றோர் தினம்
by rammalar Sun 17 Nov 2024 - 17:51
» என் நெஞ்சில் நிறைந்தவளே!
by rammalar Sun 17 Nov 2024 - 17:50
» விடியல் காண வா
by rammalar Sun 17 Nov 2024 - 17:49
» கவிதைச்சோலை - புன்னகை
by rammalar Sun 17 Nov 2024 - 14:54
» மொச்ச கொட்ட பல்லழகி- நாட்டுப்புற பாடல்
by rammalar Sat 16 Nov 2024 - 15:29
» விரதம் இருந்து துளசி பூஜை செய்வது எப்படி?
by rammalar Sat 16 Nov 2024 - 8:27
» திருப்பதியில் வனபோஜனம், கார்த்திகை தீப உற்சவம்
by rammalar Sat 16 Nov 2024 - 8:27
» மீண்டும் பிறவாத நிலை அடைய…
by rammalar Sat 16 Nov 2024 - 8:26
» பல்சுவை கதம்பம்
by rammalar Fri 15 Nov 2024 - 6:40
» மகாலட்சுமி தேவி தாயாரின் துதிப்பாடல்
by rammalar Wed 13 Nov 2024 - 7:08
» மீண்டும் தொடங்கும் தனுஷின் ‘இட்லி கடை’ ஷூட்டிங்..!
by rammalar Wed 13 Nov 2024 - 3:54
» சத்யராஜ் மனைவி கோமாவில் இருக்கிறாரா? அதுவும் இத்தனை ஆண்டுகள்?
by rammalar Wed 13 Nov 2024 - 3:53
» நீல நிற உடையில் கண்கவர் போஸில் ஹன்சிகா மோத்வானி!
by rammalar Wed 13 Nov 2024 - 3:48
» பல்சுவை தகவல் - படித்ததில் பிடித்தது
by rammalar Tue 12 Nov 2024 - 11:41
» ஆன்மிகக் கதைகள் – படகோட்டியும் பட்டாபிஷேகமும்
by rammalar Tue 12 Nov 2024 - 9:31
» காலெண்டர் பழமொழிகள்
by rammalar Tue 12 Nov 2024 - 9:25
» குழந்தைகள்தான் ஏழைகளின் செல்வம்!
by rammalar Mon 11 Nov 2024 - 8:44
» பல்சுவை
by rammalar Sat 9 Nov 2024 - 18:23
» இயற்கையை ரசியுங்கள்
by rammalar Sat 9 Nov 2024 - 18:08
» கறிவேப்பிலை ஜூஸ் & ஓட்ஸ் கஞ்சி
by rammalar Sat 9 Nov 2024 - 17:26
» தர்ப்பூசணி ஜூஸ் & எலுமிச்சை இஞ்சி பானம்
by rammalar Sat 9 Nov 2024 - 17:25
» ’மாமூல்’ நிலைமை திரும்பி விட்டது!
by rammalar Sat 9 Nov 2024 - 10:13
» பல்சுவை தகவல் - படித்ததில் பிடித்தது
by rammalar Wed 6 Nov 2024 - 5:29
தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
3 posters
Page 1 of 1
தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
இன்றைய தேடல் உலகில் அதி நவீன தொழில் நுட்பத்தின் அடிப்படையில் இயங்கி, வேறு யாரும் தொட முடியாத உயரத்தில் இருப்பது கூகுள் தேடல் சாதனங்கள்.
இணையம் சார்ந்து இயங்கும் எந்த நிறுவனமும், தனி நபர்களும், கூகுள் வழி மேற்கொள்ளப்படும் தேடல் முடிவுகளையே தங்கள் கணிப்பின் அடிப்படையாக ஏற்றுக் கொள்கின்றனர். இது எப்படி நிகழ்கிறது? என்ற கேள்வியும் அனைவரின் மனதிலும் ஏற்படுகிறது. இதற்கான விடையை இங்கு காண்போம்.
முதலில் கூகுள் தோன்றிய நிலையைக் காணலாம். விக்கிப்பீடியா தளம் தரும் தகவல்களின் படி, கூகுள் சர்ச் என்னும் பிரிவு, 1997ல் தொடங்கப்பட்டது. இதனைத் தொடங்கியவர்கள் லாரி பேஜ் மற்றும் செர்ஜி பிரின் (Larry Page and Sergey Brin).
இன்றைய நிலையில், நாளொன்றுக்கு இந்த தேடல் தளம் வழியாக 300 கோடிக்கும் மேற்பட்ட தேடல்கள் மேற்கொள்ளப்படுகின்றன. இந்த தேடலுக்கான முடிவுகள், 60 ட்ரியல்லனுக்கு (10 லட்சத்து 10 லட்சம் – 1,000,000,000,000) மேலான இணையப் பக்கங்களைத் தேடித் தரப்படுகிறது.
இவற்றைத் தேட ஒரு அட்டவணைக் குறிப்பு (index) பயன்படுத்தப்படுகிறது. இதன் அளவு 95 பீட்டா பைட்ஸ். (ஒரு பீட்டா பைட் என்பது 1000000000000000 பைட்ஸ். கிகா பைட், டெரா பைட் அடுத்து பீட்டா பைட்)அதாவது ஏறத்தாழ 10 கோடி கிகா பைட்ஸ்.
1. இணைய தளங்களை எப்படி தேடி அறிவது?
தேடல் பணியினை மேற்கொள்ள தான் “Google bot” என்னும் நவீன சாப்ட்வேர் புரோகிராம் ஒன்றை இயக்குவதாக கூகுள் கூறுகிறது. இந்த புரோகிராம் பல்லாயிரக்கணக்கான கம்ப்யூட்டர்களில் இயக்கப்பட்டு, பல இணைய தளங்களைத் தேடிச் செல்கிறது.
தான் இறுதியாகத் தேடிப் பார்த்த தளத்திலிருந்து, அடுத்த புதிய இணைய தளங்களுக்கு இந்த புரோகிராமின் தேடல்கள் செல்கின்றன. தான் எந்த இணைய தள உரிமையாளர்களிடமும், அவர்கள் தளங்களை அடிக்கடிப் பார்ப்பதற்கென பணம் வாங்கவில்லை என்று கூகுள் அறிவித்துள்ளது. ஆனால், இணைய தள உரிமையாளர்கள் நினைத்தால், தங்கள் தளங்களை கூகுள் தேடல் தீண்டாமல் இருக்கும்படி வைத்துக் கொள்ளலாம்.
2. டேட்டாவினை வகைப்படுத்தல்:
மேலே சொன்னபடி, அனைத்து தளங்களையும் பார்த்த பின்னர், அதில் கிடைத்த தகவல்கள் வகைப்படுத்தப்பட வேண்டும். இந்த தகவல்களே, 95 பீட்டா பைட்ஸ் அளவிலான வரிசைக் குறிப்பாக (index) அமைக்கப்பட்டுள்ளது. இருப்பினும், சில இணைய தளங்களை கூகுள் பாட் தேடல் புரோகிராமினால் பார்க்கப்பட முடியாமலும் போகலாம்.
3. தகவல் அறிவித்தல்:
ஒரு கூகுள் தேடலானது, இந்த வரிசைக் குறிப்பினை மட்டும் பார்த்து தன் தேவைக்கேற்ப தகவல்களை எடுப்பதில்லை. அதற்கு அதிகமான நேரம் ஆகும். அது மட்டுமின்றி, தேவையற்ற குப்பைகளும் சில சமயம் தேடல் முடிவுகளாகக் கிடைக்கும். எனவே, தேடலுக்கு அதிகத் தொடர்புள்ளவற்றை மட்டும் கண்டறிய சில சிறப்பு தேடல் வழிகள் பயன்படுத்தப்படுகின்றன.
இந்த வழிகள் மற்றவர்கள் அறியாத வகையில் இரகசியமாக உள்ளன. மேலும், தேடலில் கிடைக்கும் தகவல்கள் பலவும் இரகசியமாக வைக்கப்படுகின்றன. ஏனென்றால், இதன் வழியாக கூகுள் தேடல் சாதனமே கைப்பற்றப்படலாம்.
4. தெரிந்த தேடல் வழிகள்:
இருப்பினும் சில தேடல் வழிகளை நாம் அறிய முடிகிறது. இணைய தள டேட்டாவின் வகை (தேடல் சொற்களுக்கு எந்த அளவில் தொடர்புடையது என்ற அடிப்படையில்) அடுத்து டேட்டாவின் தன்மை. இதற்கு சொல் எழுத்து சோதனை (spell check) மேற்கொள்ளப்படுகிறது.
இதன் மூலம் உண்மையிலேயே நல்ல தகவல்களைக் கொண்டுள்ள இணையப் பக்கங்களிலிருந்து, அர்த்தமற்ற தளங்கள் இனம் காணப்பட்டு பிரிக்கப் படுகின்றன. இணையத் தளங்கள் தரும் டேட்டாவின் அண்மைத் தன்மை. 1996ல் பதியப்பட்ட ஒரு தளத்தின் தகவல், 2013ல் பதியப் பட்ட தளங்களின் முன்னே காட்டப்படுவதில்லை.
அடுத்ததாக, இணைய தளத்தின் நம்பகத் தன்மை. உண்மையிலேயே தளம் சொல் லும் தகவல் சார்ந்ததா? இல்லை, போலியான மால்வேர் கொண்டுள்ள தளமா எனக் கண்டறிதல். அடுத்ததாக, இணைய தளத்தின் பெயர் மற்றும் முகவரி சரி பார்த்து அறிதல்.
இதனைத் தொடர்ந்து சொற்கள், அவற்றின் இணைச் சொற்களைப் பிரித்து அறிதல் மேற்கொள்ளப்படு. இதன் பின்னர், குறிப்பிட்ட இணைய தளத்தை எத்தனை லிங்க்குகள் சுட்டிக் காட்டுகின்றன மற்றும் அவற்றின் நம்பகத்தன்மை குறித்து ஆய்வு செய்யப்படுகிறது.
இறுதியாகச் சொல்லப்பட்ட நம்பகத் தன்மை “PageRank.” என்று சொல்லப்படும்
தன்மையின் அடிப்படையில் செயல்படுத்தப்படுகிறது. ஓர் இணையப் பக்கத்தின் தர வரிசை அதற்கான லிங்க் எப்படிப்பட்ட மூலத்திலிருந்து வருகிறது என்பதை அறிவதில் உள்ளது.
இதன் அடிப்படையில், ஒரு தளம் தேடல் பட்டியல் முடிவுகள் அறிவிக்கும் பட்டியலில் முதலில் இடம் பிடிக்கும். இதிலும் அதன் தன்மை கண்டறியப்படுகிறது. ஒரு தளத்திற்கு அதிகமான எண்ணிக்கையில், ஆனால், தரம் குறைந்த தொடர்புகளின் அடிப்படையில் தொடர்பு இருக்கலாம்.
இன்னொரு தளத்திற்கு நல்ல தரமான தொடர்புகள் சுட்டிக் காட்டும் தன்மை இருக்கலாம். அப்போது இரண்டாவதாகச் சொல்லப்பட்டதே, “PageRank” மதிப்பெண் அதிகம் பெற்று, தேடல் முடிவுகளில் முதல் பக்கத்தில் இடம் பெறும்.
இதனால் தான், இணைய தளங்களை உருவாக்கிப் பதிப்பவர்கள், தங்கள் மதிப்பெண்ணை “PageRank” ஐ எப்படி உயர்த்துவது என எப்போதும் சிந்திக்கின்றனர். அதற்கான அடிப்படைக் காரணிகளை அறிந்து அவற்றை உயர்த்துகின்றனர்.
மெயிலில் வந்தவை
இன்றைய தேடல் உலகில் அதி நவீன தொழில் நுட்பத்தின் அடிப்படையில் இயங்கி, வேறு யாரும் தொட முடியாத உயரத்தில் இருப்பது கூகுள் தேடல் சாதனங்கள்.
இணையம் சார்ந்து இயங்கும் எந்த நிறுவனமும், தனி நபர்களும், கூகுள் வழி மேற்கொள்ளப்படும் தேடல் முடிவுகளையே தங்கள் கணிப்பின் அடிப்படையாக ஏற்றுக் கொள்கின்றனர். இது எப்படி நிகழ்கிறது? என்ற கேள்வியும் அனைவரின் மனதிலும் ஏற்படுகிறது. இதற்கான விடையை இங்கு காண்போம்.
முதலில் கூகுள் தோன்றிய நிலையைக் காணலாம். விக்கிப்பீடியா தளம் தரும் தகவல்களின் படி, கூகுள் சர்ச் என்னும் பிரிவு, 1997ல் தொடங்கப்பட்டது. இதனைத் தொடங்கியவர்கள் லாரி பேஜ் மற்றும் செர்ஜி பிரின் (Larry Page and Sergey Brin).
இன்றைய நிலையில், நாளொன்றுக்கு இந்த தேடல் தளம் வழியாக 300 கோடிக்கும் மேற்பட்ட தேடல்கள் மேற்கொள்ளப்படுகின்றன. இந்த தேடலுக்கான முடிவுகள், 60 ட்ரியல்லனுக்கு (10 லட்சத்து 10 லட்சம் – 1,000,000,000,000) மேலான இணையப் பக்கங்களைத் தேடித் தரப்படுகிறது.
இவற்றைத் தேட ஒரு அட்டவணைக் குறிப்பு (index) பயன்படுத்தப்படுகிறது. இதன் அளவு 95 பீட்டா பைட்ஸ். (ஒரு பீட்டா பைட் என்பது 1000000000000000 பைட்ஸ். கிகா பைட், டெரா பைட் அடுத்து பீட்டா பைட்)அதாவது ஏறத்தாழ 10 கோடி கிகா பைட்ஸ்.
1. இணைய தளங்களை எப்படி தேடி அறிவது?
தேடல் பணியினை மேற்கொள்ள தான் “Google bot” என்னும் நவீன சாப்ட்வேர் புரோகிராம் ஒன்றை இயக்குவதாக கூகுள் கூறுகிறது. இந்த புரோகிராம் பல்லாயிரக்கணக்கான கம்ப்யூட்டர்களில் இயக்கப்பட்டு, பல இணைய தளங்களைத் தேடிச் செல்கிறது.
தான் இறுதியாகத் தேடிப் பார்த்த தளத்திலிருந்து, அடுத்த புதிய இணைய தளங்களுக்கு இந்த புரோகிராமின் தேடல்கள் செல்கின்றன. தான் எந்த இணைய தள உரிமையாளர்களிடமும், அவர்கள் தளங்களை அடிக்கடிப் பார்ப்பதற்கென பணம் வாங்கவில்லை என்று கூகுள் அறிவித்துள்ளது. ஆனால், இணைய தள உரிமையாளர்கள் நினைத்தால், தங்கள் தளங்களை கூகுள் தேடல் தீண்டாமல் இருக்கும்படி வைத்துக் கொள்ளலாம்.
2. டேட்டாவினை வகைப்படுத்தல்:
மேலே சொன்னபடி, அனைத்து தளங்களையும் பார்த்த பின்னர், அதில் கிடைத்த தகவல்கள் வகைப்படுத்தப்பட வேண்டும். இந்த தகவல்களே, 95 பீட்டா பைட்ஸ் அளவிலான வரிசைக் குறிப்பாக (index) அமைக்கப்பட்டுள்ளது. இருப்பினும், சில இணைய தளங்களை கூகுள் பாட் தேடல் புரோகிராமினால் பார்க்கப்பட முடியாமலும் போகலாம்.
3. தகவல் அறிவித்தல்:
ஒரு கூகுள் தேடலானது, இந்த வரிசைக் குறிப்பினை மட்டும் பார்த்து தன் தேவைக்கேற்ப தகவல்களை எடுப்பதில்லை. அதற்கு அதிகமான நேரம் ஆகும். அது மட்டுமின்றி, தேவையற்ற குப்பைகளும் சில சமயம் தேடல் முடிவுகளாகக் கிடைக்கும். எனவே, தேடலுக்கு அதிகத் தொடர்புள்ளவற்றை மட்டும் கண்டறிய சில சிறப்பு தேடல் வழிகள் பயன்படுத்தப்படுகின்றன.
இந்த வழிகள் மற்றவர்கள் அறியாத வகையில் இரகசியமாக உள்ளன. மேலும், தேடலில் கிடைக்கும் தகவல்கள் பலவும் இரகசியமாக வைக்கப்படுகின்றன. ஏனென்றால், இதன் வழியாக கூகுள் தேடல் சாதனமே கைப்பற்றப்படலாம்.
4. தெரிந்த தேடல் வழிகள்:
இருப்பினும் சில தேடல் வழிகளை நாம் அறிய முடிகிறது. இணைய தள டேட்டாவின் வகை (தேடல் சொற்களுக்கு எந்த அளவில் தொடர்புடையது என்ற அடிப்படையில்) அடுத்து டேட்டாவின் தன்மை. இதற்கு சொல் எழுத்து சோதனை (spell check) மேற்கொள்ளப்படுகிறது.
இதன் மூலம் உண்மையிலேயே நல்ல தகவல்களைக் கொண்டுள்ள இணையப் பக்கங்களிலிருந்து, அர்த்தமற்ற தளங்கள் இனம் காணப்பட்டு பிரிக்கப் படுகின்றன. இணையத் தளங்கள் தரும் டேட்டாவின் அண்மைத் தன்மை. 1996ல் பதியப்பட்ட ஒரு தளத்தின் தகவல், 2013ல் பதியப் பட்ட தளங்களின் முன்னே காட்டப்படுவதில்லை.
அடுத்ததாக, இணைய தளத்தின் நம்பகத் தன்மை. உண்மையிலேயே தளம் சொல் லும் தகவல் சார்ந்ததா? இல்லை, போலியான மால்வேர் கொண்டுள்ள தளமா எனக் கண்டறிதல். அடுத்ததாக, இணைய தளத்தின் பெயர் மற்றும் முகவரி சரி பார்த்து அறிதல்.
இதனைத் தொடர்ந்து சொற்கள், அவற்றின் இணைச் சொற்களைப் பிரித்து அறிதல் மேற்கொள்ளப்படு. இதன் பின்னர், குறிப்பிட்ட இணைய தளத்தை எத்தனை லிங்க்குகள் சுட்டிக் காட்டுகின்றன மற்றும் அவற்றின் நம்பகத்தன்மை குறித்து ஆய்வு செய்யப்படுகிறது.
இறுதியாகச் சொல்லப்பட்ட நம்பகத் தன்மை “PageRank.” என்று சொல்லப்படும்
தன்மையின் அடிப்படையில் செயல்படுத்தப்படுகிறது. ஓர் இணையப் பக்கத்தின் தர வரிசை அதற்கான லிங்க் எப்படிப்பட்ட மூலத்திலிருந்து வருகிறது என்பதை அறிவதில் உள்ளது.
இதன் அடிப்படையில், ஒரு தளம் தேடல் பட்டியல் முடிவுகள் அறிவிக்கும் பட்டியலில் முதலில் இடம் பிடிக்கும். இதிலும் அதன் தன்மை கண்டறியப்படுகிறது. ஒரு தளத்திற்கு அதிகமான எண்ணிக்கையில், ஆனால், தரம் குறைந்த தொடர்புகளின் அடிப்படையில் தொடர்பு இருக்கலாம்.
இன்னொரு தளத்திற்கு நல்ல தரமான தொடர்புகள் சுட்டிக் காட்டும் தன்மை இருக்கலாம். அப்போது இரண்டாவதாகச் சொல்லப்பட்டதே, “PageRank” மதிப்பெண் அதிகம் பெற்று, தேடல் முடிவுகளில் முதல் பக்கத்தில் இடம் பெறும்.
இதனால் தான், இணைய தளங்களை உருவாக்கிப் பதிப்பவர்கள், தங்கள் மதிப்பெண்ணை “PageRank” ஐ எப்படி உயர்த்துவது என எப்போதும் சிந்திக்கின்றனர். அதற்கான அடிப்படைக் காரணிகளை அறிந்து அவற்றை உயர்த்துகின்றனர்.
மெயிலில் வந்தவை
படைப்புகளை வணங்காதீர்.
படைத்தவனை மட்டும் வணங்குங்கள்.
ahmad78- நிர்வாகக்குழுவினர்
- பதிவுகள்:- : 14252
மதிப்பீடுகள் : 786
Re: தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
சிறப்பான தகவல்... பகிர்வுக்கு நன்றி
கவியருவி ம. ரமேஷ்- புதுமுகம்
- பதிவுகள்:- : 423
மதிப்பீடுகள் : 50
Re: தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
தகவலுக்கு நன்றி அஹமட்
உங்களைத் தொழவைக்கும் முன் நீங்கள் தொழுது கொள்ளுங்கள்.
Similar topics
» கூகிள் தேடலை மெருகூட்டும் இன்ஸ்டன்ட் பிரிவ்யு!!
» கூகிள் ப்ளஸ் என்றால் என்ன?
» கூகிள் அறிமுகப்படுத்தும் Nexus 6
» கூகிள் பேக்ரவுண்ட் இட
» யு.எஸ்.பி. டிரைவில் கூகிள் குரோம் ஓ.எஸ்.
» கூகிள் ப்ளஸ் என்றால் என்ன?
» கூகிள் அறிமுகப்படுத்தும் Nexus 6
» கூகிள் பேக்ரவுண்ட் இட
» யு.எஸ்.பி. டிரைவில் கூகிள் குரோம் ஓ.எஸ்.
Page 1 of 1
Permissions in this forum:
You cannot reply to topics in this forum