Latest topics
» வாழ்க்கையில் ரிஸ்க் எடுக்க கற்றுக்கொள்ளுங்கள்by rammalar Today at 4:51
» இணையத்தில் ரசித்தவை
by rammalar Yesterday at 15:57
» அவளே பேரரழகி...!
by rammalar Yesterday at 7:31
» ஒரு மனிதனின் அதிகபட்ச திருப்தியும், வெற்றியும்!
by rammalar Yesterday at 7:19
» பேசி ! பேசி ஆளை வீழ்த்துவது எப்படி !
by rammalar Yesterday at 7:16
» இன்றைய கோபுர தரிசனம் ????????
by rammalar Yesterday at 7:15
» அழகான ரோஜாக்கள் உங்களுக்காக இங்கே..
by rammalar Yesterday at 7:14
» தட்கலில் டிக்கெட் புக்கிங் செய்ய எளிதான வழிகள் என்ன?
by rammalar Yesterday at 4:05
» ஜொலிப்பதில்லை!
by rammalar Wed 15 May 2024 - 11:40
» ஸ்டார் விமர்சனம்
by rammalar Wed 15 May 2024 - 10:22
» கவினின் 'ஸ்டார்' படத்தை ஓடிடியில் எப்போது, எங்கு பார்க்கலாம்.?
by rammalar Wed 15 May 2024 - 10:14
» சிந்தனை சிதறல்கள் ( மலை இலக்கானால்...)
by rammalar Wed 15 May 2024 - 7:04
» சிஎஸ்கேவுக்கு நல்ல செய்தி... வெற்றியுடன் முடித்தது டெல்லி - இனி இந்த 3 அணிகளுக்கு தான் மோதல்!
by rammalar Wed 15 May 2024 - 4:10
» சிறுகதை - ஒரு காதலி தாயாகும்போது!
by rammalar Tue 14 May 2024 - 19:44
» வாயுள்ள பிள்ளை பிழைக்கும்!
by rammalar Tue 14 May 2024 - 19:37
» இணையத்தில் ரசித்தவை
by rammalar Tue 14 May 2024 - 19:24
» அஜித் பட விவகாரம்- த்ரிஷா எடுத்த முடிவு
by rammalar Tue 14 May 2024 - 16:18
» தென்காசியில் வீர தீர சூரன் -படப்பிடிப்பு
by rammalar Tue 14 May 2024 - 16:06
» வீட்டில் தங்கம் சேர வேண்டுமா?
by rammalar Tue 14 May 2024 - 15:53
» ரசித்தவை...
by rammalar Tue 14 May 2024 - 13:49
» ஆரிய பவன்
by rammalar Tue 14 May 2024 - 11:33
» மாநகர பேருந்து, புறநகர் - மெட்ரோ ரெயிலில் பயணிக்க ஒரே டிக்கெட் முறை அடுத்த மாதம் அமல்
by rammalar Tue 14 May 2024 - 10:54
» இதுதான் கலிகாலம்…
by rammalar Tue 14 May 2024 - 9:34
» வாசமில்லா மலரிது
by rammalar Tue 14 May 2024 - 9:21
» தேனில்லா மலர்...
by rammalar Tue 14 May 2024 - 9:17
» இனிய காலை வணக்கம்
by rammalar Tue 14 May 2024 - 7:36
» சார்! இந்த கிரைன்டர் என்ன விலை?
by rammalar Tue 14 May 2024 - 7:32
» வாழ்வின் வலிகளும் உண்மைகளும்!
by rammalar Tue 14 May 2024 - 7:23
» இது தெரியுமா ? குழந்தையின் வளர்ச்சிக்கு இந்த ஒரு கிழங்கு கொடுங்க போதும்..!
by rammalar Tue 14 May 2024 - 6:08
» சிஎஸ்கேவின் கடைசி போட்டிக்கு மழை ஆபத்து.. போட்டி ரத்தானால், பிளே ஆப்க்கு செல்லுமா சென்னை?
by rammalar Mon 13 May 2024 - 19:05
» நீங்கள் கோவிஷீல்டு ஊசி போட்டவரா..? அப்போ இதை மட்டும் செய்யுங்க.. : மா.சுப்பிரமணியன்..!
by rammalar Mon 13 May 2024 - 18:58
» 11 லட்சம் மதிப்புள்ள பொருட்களை தான் படித்த பள்ளிக்கு கொடுத்த நடிகர் அப்புக்குட்டி..!
by rammalar Mon 13 May 2024 - 18:52
» கன்னத்தில் விழும் குழி அதிர்ஷ்டத்தின் அறிகுறியா?
by rammalar Mon 13 May 2024 - 10:53
» சாளக்ராமம் என்றால் என்ன?
by rammalar Mon 13 May 2024 - 10:30
» "தாயில்லாமல் நாமில்லை"... இன்று உலக அன்னையர் தினம்..!
by rammalar Sun 12 May 2024 - 10:11
தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
3 posters
Page 1 of 1
தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
இன்றைய தேடல் உலகில் அதி நவீன தொழில் நுட்பத்தின் அடிப்படையில் இயங்கி, வேறு யாரும் தொட முடியாத உயரத்தில் இருப்பது கூகுள் தேடல் சாதனங்கள்.
இணையம் சார்ந்து இயங்கும் எந்த நிறுவனமும், தனி நபர்களும், கூகுள் வழி மேற்கொள்ளப்படும் தேடல் முடிவுகளையே தங்கள் கணிப்பின் அடிப்படையாக ஏற்றுக் கொள்கின்றனர். இது எப்படி நிகழ்கிறது? என்ற கேள்வியும் அனைவரின் மனதிலும் ஏற்படுகிறது. இதற்கான விடையை இங்கு காண்போம்.
முதலில் கூகுள் தோன்றிய நிலையைக் காணலாம். விக்கிப்பீடியா தளம் தரும் தகவல்களின் படி, கூகுள் சர்ச் என்னும் பிரிவு, 1997ல் தொடங்கப்பட்டது. இதனைத் தொடங்கியவர்கள் லாரி பேஜ் மற்றும் செர்ஜி பிரின் (Larry Page and Sergey Brin).
இன்றைய நிலையில், நாளொன்றுக்கு இந்த தேடல் தளம் வழியாக 300 கோடிக்கும் மேற்பட்ட தேடல்கள் மேற்கொள்ளப்படுகின்றன. இந்த தேடலுக்கான முடிவுகள், 60 ட்ரியல்லனுக்கு (10 லட்சத்து 10 லட்சம் – 1,000,000,000,000) மேலான இணையப் பக்கங்களைத் தேடித் தரப்படுகிறது.
இவற்றைத் தேட ஒரு அட்டவணைக் குறிப்பு (index) பயன்படுத்தப்படுகிறது. இதன் அளவு 95 பீட்டா பைட்ஸ். (ஒரு பீட்டா பைட் என்பது 1000000000000000 பைட்ஸ். கிகா பைட், டெரா பைட் அடுத்து பீட்டா பைட்)அதாவது ஏறத்தாழ 10 கோடி கிகா பைட்ஸ்.
1. இணைய தளங்களை எப்படி தேடி அறிவது?
தேடல் பணியினை மேற்கொள்ள தான் “Google bot” என்னும் நவீன சாப்ட்வேர் புரோகிராம் ஒன்றை இயக்குவதாக கூகுள் கூறுகிறது. இந்த புரோகிராம் பல்லாயிரக்கணக்கான கம்ப்யூட்டர்களில் இயக்கப்பட்டு, பல இணைய தளங்களைத் தேடிச் செல்கிறது.
தான் இறுதியாகத் தேடிப் பார்த்த தளத்திலிருந்து, அடுத்த புதிய இணைய தளங்களுக்கு இந்த புரோகிராமின் தேடல்கள் செல்கின்றன. தான் எந்த இணைய தள உரிமையாளர்களிடமும், அவர்கள் தளங்களை அடிக்கடிப் பார்ப்பதற்கென பணம் வாங்கவில்லை என்று கூகுள் அறிவித்துள்ளது. ஆனால், இணைய தள உரிமையாளர்கள் நினைத்தால், தங்கள் தளங்களை கூகுள் தேடல் தீண்டாமல் இருக்கும்படி வைத்துக் கொள்ளலாம்.
2. டேட்டாவினை வகைப்படுத்தல்:
மேலே சொன்னபடி, அனைத்து தளங்களையும் பார்த்த பின்னர், அதில் கிடைத்த தகவல்கள் வகைப்படுத்தப்பட வேண்டும். இந்த தகவல்களே, 95 பீட்டா பைட்ஸ் அளவிலான வரிசைக் குறிப்பாக (index) அமைக்கப்பட்டுள்ளது. இருப்பினும், சில இணைய தளங்களை கூகுள் பாட் தேடல் புரோகிராமினால் பார்க்கப்பட முடியாமலும் போகலாம்.
3. தகவல் அறிவித்தல்:
ஒரு கூகுள் தேடலானது, இந்த வரிசைக் குறிப்பினை மட்டும் பார்த்து தன் தேவைக்கேற்ப தகவல்களை எடுப்பதில்லை. அதற்கு அதிகமான நேரம் ஆகும். அது மட்டுமின்றி, தேவையற்ற குப்பைகளும் சில சமயம் தேடல் முடிவுகளாகக் கிடைக்கும். எனவே, தேடலுக்கு அதிகத் தொடர்புள்ளவற்றை மட்டும் கண்டறிய சில சிறப்பு தேடல் வழிகள் பயன்படுத்தப்படுகின்றன.
இந்த வழிகள் மற்றவர்கள் அறியாத வகையில் இரகசியமாக உள்ளன. மேலும், தேடலில் கிடைக்கும் தகவல்கள் பலவும் இரகசியமாக வைக்கப்படுகின்றன. ஏனென்றால், இதன் வழியாக கூகுள் தேடல் சாதனமே கைப்பற்றப்படலாம்.
4. தெரிந்த தேடல் வழிகள்:
இருப்பினும் சில தேடல் வழிகளை நாம் அறிய முடிகிறது. இணைய தள டேட்டாவின் வகை (தேடல் சொற்களுக்கு எந்த அளவில் தொடர்புடையது என்ற அடிப்படையில்) அடுத்து டேட்டாவின் தன்மை. இதற்கு சொல் எழுத்து சோதனை (spell check) மேற்கொள்ளப்படுகிறது.
இதன் மூலம் உண்மையிலேயே நல்ல தகவல்களைக் கொண்டுள்ள இணையப் பக்கங்களிலிருந்து, அர்த்தமற்ற தளங்கள் இனம் காணப்பட்டு பிரிக்கப் படுகின்றன. இணையத் தளங்கள் தரும் டேட்டாவின் அண்மைத் தன்மை. 1996ல் பதியப்பட்ட ஒரு தளத்தின் தகவல், 2013ல் பதியப் பட்ட தளங்களின் முன்னே காட்டப்படுவதில்லை.
அடுத்ததாக, இணைய தளத்தின் நம்பகத் தன்மை. உண்மையிலேயே தளம் சொல் லும் தகவல் சார்ந்ததா? இல்லை, போலியான மால்வேர் கொண்டுள்ள தளமா எனக் கண்டறிதல். அடுத்ததாக, இணைய தளத்தின் பெயர் மற்றும் முகவரி சரி பார்த்து அறிதல்.
இதனைத் தொடர்ந்து சொற்கள், அவற்றின் இணைச் சொற்களைப் பிரித்து அறிதல் மேற்கொள்ளப்படு. இதன் பின்னர், குறிப்பிட்ட இணைய தளத்தை எத்தனை லிங்க்குகள் சுட்டிக் காட்டுகின்றன மற்றும் அவற்றின் நம்பகத்தன்மை குறித்து ஆய்வு செய்யப்படுகிறது.
இறுதியாகச் சொல்லப்பட்ட நம்பகத் தன்மை “PageRank.” என்று சொல்லப்படும்
தன்மையின் அடிப்படையில் செயல்படுத்தப்படுகிறது. ஓர் இணையப் பக்கத்தின் தர வரிசை அதற்கான லிங்க் எப்படிப்பட்ட மூலத்திலிருந்து வருகிறது என்பதை அறிவதில் உள்ளது.
இதன் அடிப்படையில், ஒரு தளம் தேடல் பட்டியல் முடிவுகள் அறிவிக்கும் பட்டியலில் முதலில் இடம் பிடிக்கும். இதிலும் அதன் தன்மை கண்டறியப்படுகிறது. ஒரு தளத்திற்கு அதிகமான எண்ணிக்கையில், ஆனால், தரம் குறைந்த தொடர்புகளின் அடிப்படையில் தொடர்பு இருக்கலாம்.
இன்னொரு தளத்திற்கு நல்ல தரமான தொடர்புகள் சுட்டிக் காட்டும் தன்மை இருக்கலாம். அப்போது இரண்டாவதாகச் சொல்லப்பட்டதே, “PageRank” மதிப்பெண் அதிகம் பெற்று, தேடல் முடிவுகளில் முதல் பக்கத்தில் இடம் பெறும்.
இதனால் தான், இணைய தளங்களை உருவாக்கிப் பதிப்பவர்கள், தங்கள் மதிப்பெண்ணை “PageRank” ஐ எப்படி உயர்த்துவது என எப்போதும் சிந்திக்கின்றனர். அதற்கான அடிப்படைக் காரணிகளை அறிந்து அவற்றை உயர்த்துகின்றனர்.
மெயிலில் வந்தவை
இன்றைய தேடல் உலகில் அதி நவீன தொழில் நுட்பத்தின் அடிப்படையில் இயங்கி, வேறு யாரும் தொட முடியாத உயரத்தில் இருப்பது கூகுள் தேடல் சாதனங்கள்.
இணையம் சார்ந்து இயங்கும் எந்த நிறுவனமும், தனி நபர்களும், கூகுள் வழி மேற்கொள்ளப்படும் தேடல் முடிவுகளையே தங்கள் கணிப்பின் அடிப்படையாக ஏற்றுக் கொள்கின்றனர். இது எப்படி நிகழ்கிறது? என்ற கேள்வியும் அனைவரின் மனதிலும் ஏற்படுகிறது. இதற்கான விடையை இங்கு காண்போம்.
முதலில் கூகுள் தோன்றிய நிலையைக் காணலாம். விக்கிப்பீடியா தளம் தரும் தகவல்களின் படி, கூகுள் சர்ச் என்னும் பிரிவு, 1997ல் தொடங்கப்பட்டது. இதனைத் தொடங்கியவர்கள் லாரி பேஜ் மற்றும் செர்ஜி பிரின் (Larry Page and Sergey Brin).
இன்றைய நிலையில், நாளொன்றுக்கு இந்த தேடல் தளம் வழியாக 300 கோடிக்கும் மேற்பட்ட தேடல்கள் மேற்கொள்ளப்படுகின்றன. இந்த தேடலுக்கான முடிவுகள், 60 ட்ரியல்லனுக்கு (10 லட்சத்து 10 லட்சம் – 1,000,000,000,000) மேலான இணையப் பக்கங்களைத் தேடித் தரப்படுகிறது.
இவற்றைத் தேட ஒரு அட்டவணைக் குறிப்பு (index) பயன்படுத்தப்படுகிறது. இதன் அளவு 95 பீட்டா பைட்ஸ். (ஒரு பீட்டா பைட் என்பது 1000000000000000 பைட்ஸ். கிகா பைட், டெரா பைட் அடுத்து பீட்டா பைட்)அதாவது ஏறத்தாழ 10 கோடி கிகா பைட்ஸ்.
1. இணைய தளங்களை எப்படி தேடி அறிவது?
தேடல் பணியினை மேற்கொள்ள தான் “Google bot” என்னும் நவீன சாப்ட்வேர் புரோகிராம் ஒன்றை இயக்குவதாக கூகுள் கூறுகிறது. இந்த புரோகிராம் பல்லாயிரக்கணக்கான கம்ப்யூட்டர்களில் இயக்கப்பட்டு, பல இணைய தளங்களைத் தேடிச் செல்கிறது.
தான் இறுதியாகத் தேடிப் பார்த்த தளத்திலிருந்து, அடுத்த புதிய இணைய தளங்களுக்கு இந்த புரோகிராமின் தேடல்கள் செல்கின்றன. தான் எந்த இணைய தள உரிமையாளர்களிடமும், அவர்கள் தளங்களை அடிக்கடிப் பார்ப்பதற்கென பணம் வாங்கவில்லை என்று கூகுள் அறிவித்துள்ளது. ஆனால், இணைய தள உரிமையாளர்கள் நினைத்தால், தங்கள் தளங்களை கூகுள் தேடல் தீண்டாமல் இருக்கும்படி வைத்துக் கொள்ளலாம்.
2. டேட்டாவினை வகைப்படுத்தல்:
மேலே சொன்னபடி, அனைத்து தளங்களையும் பார்த்த பின்னர், அதில் கிடைத்த தகவல்கள் வகைப்படுத்தப்பட வேண்டும். இந்த தகவல்களே, 95 பீட்டா பைட்ஸ் அளவிலான வரிசைக் குறிப்பாக (index) அமைக்கப்பட்டுள்ளது. இருப்பினும், சில இணைய தளங்களை கூகுள் பாட் தேடல் புரோகிராமினால் பார்க்கப்பட முடியாமலும் போகலாம்.
3. தகவல் அறிவித்தல்:
ஒரு கூகுள் தேடலானது, இந்த வரிசைக் குறிப்பினை மட்டும் பார்த்து தன் தேவைக்கேற்ப தகவல்களை எடுப்பதில்லை. அதற்கு அதிகமான நேரம் ஆகும். அது மட்டுமின்றி, தேவையற்ற குப்பைகளும் சில சமயம் தேடல் முடிவுகளாகக் கிடைக்கும். எனவே, தேடலுக்கு அதிகத் தொடர்புள்ளவற்றை மட்டும் கண்டறிய சில சிறப்பு தேடல் வழிகள் பயன்படுத்தப்படுகின்றன.
இந்த வழிகள் மற்றவர்கள் அறியாத வகையில் இரகசியமாக உள்ளன. மேலும், தேடலில் கிடைக்கும் தகவல்கள் பலவும் இரகசியமாக வைக்கப்படுகின்றன. ஏனென்றால், இதன் வழியாக கூகுள் தேடல் சாதனமே கைப்பற்றப்படலாம்.
4. தெரிந்த தேடல் வழிகள்:
இருப்பினும் சில தேடல் வழிகளை நாம் அறிய முடிகிறது. இணைய தள டேட்டாவின் வகை (தேடல் சொற்களுக்கு எந்த அளவில் தொடர்புடையது என்ற அடிப்படையில்) அடுத்து டேட்டாவின் தன்மை. இதற்கு சொல் எழுத்து சோதனை (spell check) மேற்கொள்ளப்படுகிறது.
இதன் மூலம் உண்மையிலேயே நல்ல தகவல்களைக் கொண்டுள்ள இணையப் பக்கங்களிலிருந்து, அர்த்தமற்ற தளங்கள் இனம் காணப்பட்டு பிரிக்கப் படுகின்றன. இணையத் தளங்கள் தரும் டேட்டாவின் அண்மைத் தன்மை. 1996ல் பதியப்பட்ட ஒரு தளத்தின் தகவல், 2013ல் பதியப் பட்ட தளங்களின் முன்னே காட்டப்படுவதில்லை.
அடுத்ததாக, இணைய தளத்தின் நம்பகத் தன்மை. உண்மையிலேயே தளம் சொல் லும் தகவல் சார்ந்ததா? இல்லை, போலியான மால்வேர் கொண்டுள்ள தளமா எனக் கண்டறிதல். அடுத்ததாக, இணைய தளத்தின் பெயர் மற்றும் முகவரி சரி பார்த்து அறிதல்.
இதனைத் தொடர்ந்து சொற்கள், அவற்றின் இணைச் சொற்களைப் பிரித்து அறிதல் மேற்கொள்ளப்படு. இதன் பின்னர், குறிப்பிட்ட இணைய தளத்தை எத்தனை லிங்க்குகள் சுட்டிக் காட்டுகின்றன மற்றும் அவற்றின் நம்பகத்தன்மை குறித்து ஆய்வு செய்யப்படுகிறது.
இறுதியாகச் சொல்லப்பட்ட நம்பகத் தன்மை “PageRank.” என்று சொல்லப்படும்
தன்மையின் அடிப்படையில் செயல்படுத்தப்படுகிறது. ஓர் இணையப் பக்கத்தின் தர வரிசை அதற்கான லிங்க் எப்படிப்பட்ட மூலத்திலிருந்து வருகிறது என்பதை அறிவதில் உள்ளது.
இதன் அடிப்படையில், ஒரு தளம் தேடல் பட்டியல் முடிவுகள் அறிவிக்கும் பட்டியலில் முதலில் இடம் பிடிக்கும். இதிலும் அதன் தன்மை கண்டறியப்படுகிறது. ஒரு தளத்திற்கு அதிகமான எண்ணிக்கையில், ஆனால், தரம் குறைந்த தொடர்புகளின் அடிப்படையில் தொடர்பு இருக்கலாம்.
இன்னொரு தளத்திற்கு நல்ல தரமான தொடர்புகள் சுட்டிக் காட்டும் தன்மை இருக்கலாம். அப்போது இரண்டாவதாகச் சொல்லப்பட்டதே, “PageRank” மதிப்பெண் அதிகம் பெற்று, தேடல் முடிவுகளில் முதல் பக்கத்தில் இடம் பெறும்.
இதனால் தான், இணைய தளங்களை உருவாக்கிப் பதிப்பவர்கள், தங்கள் மதிப்பெண்ணை “PageRank” ஐ எப்படி உயர்த்துவது என எப்போதும் சிந்திக்கின்றனர். அதற்கான அடிப்படைக் காரணிகளை அறிந்து அவற்றை உயர்த்துகின்றனர்.
மெயிலில் வந்தவை
படைப்புகளை வணங்காதீர்.
படைத்தவனை மட்டும் வணங்குங்கள்.
ahmad78- நிர்வாகக்குழுவினர்
- பதிவுகள்:- : 14252
மதிப்பீடுகள் : 786
Re: தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
சிறப்பான தகவல்... பகிர்வுக்கு நன்றி
கவியருவி ம. ரமேஷ்- புதுமுகம்
- பதிவுகள்:- : 423
மதிப்பீடுகள் : 50
Re: தேடலை கூகிள் எவ்வாறு மேற்கொள்கின்றது?
தகவலுக்கு நன்றி அஹமட்
உங்களைத் தொழவைக்கும் முன் நீங்கள் தொழுது கொள்ளுங்கள்.
Similar topics
» கூகிள் தேடலை மெருகூட்டும் இன்ஸ்டன்ட் பிரிவ்யு!!
» கூகிள் ப்ளஸ் என்றால் என்ன?
» கூகிள் அறிமுகப்படுத்தும் Nexus 6
» கூகிள் பேக்ரவுண்ட் இட
» யு.எஸ்.பி. டிரைவில் கூகிள் குரோம் ஓ.எஸ்.
» கூகிள் ப்ளஸ் என்றால் என்ன?
» கூகிள் அறிமுகப்படுத்தும் Nexus 6
» கூகிள் பேக்ரவுண்ட் இட
» யு.எஸ்.பி. டிரைவில் கூகிள் குரோம் ஓ.எஸ்.
Page 1 of 1
Permissions in this forum:
You cannot reply to topics in this forum
|
|