yd2333Ôƶ¥µç×ÓÓÎÏ·

½Ó´ýÀ´µ½ÉϺ£yd2333Ôƶ¥µç×ÓÓÎÏ·ÔƲÖ,½ß³ÏΪÄúÌṩ:µçÉִ̲¢ÅäËÍ,ÀäÁ´²Ö´¢ÅäËÍ,»õ²ÖÍâ°üµÈ²ÖÅäÒ»Ì廯ЧÀÍ!ÊÕ²ØÎÒÃÇ µçÉÌÔÆ²Ö ÍøÕ¾µØͼ

½Ó´ýÀ´µ½ÉϺ£yd2333Ôƶ¥µç×ÓÓÎÏ·ÔƲÖ,½ß³ÏΪÄúÌṩ:µçÉִ̲¢ÅäËÍ,ÀäÁ´²Ö´¢ÅäËÍ,»õ²ÖÍâ°üµÈ²ÖÅäÒ»Ì廯ЧÀÍ!

È«ÎÂÇøʳƷ²ÖÅäÎïÁ÷ЧÀÍÉÌ20Íò©O×ÔÓª²Ö+AAAA¼¶ÎïÁ÷+È«¹úÀäÁ´ÎïÁ÷°ÙÇ¿

182-0218-6162400-096-2966

yd2333Ôƶ¥µç×ÓÓÎÏ·¶¯Ì¬

ÈÈËÑÒªº¦´Ê£º µçÉÌÒ»¼þ´ú·¢ ÀäÁ´ÅäËÍ ÉçÇøÍŹº²ÖÅä ʳƷ²Ö´¢´ú·¢»õ ÔöֵЧÀÍ

ÔÚHadoop¼¯ÈºÏµÄÖÇÄܵçÍøÊý¾ÝÔÆ»õ²ÖÉè¼Æ

À´Ô´£º±¾Õ¾ | Ðû²¼ÈÕÆÚ£º2023-03-04

0 ÒýÑÔ

ÖÇÄܵçÍøÊǵçÍøµÄÖÇÄÜ»¯, ͨ¹ý½«ÐÅÏ¢¼¼Êõ¡¢Í¨Ðż¼Êõ¡¢ÅÌËã»ú¼¼ÊõÓëÔ­ÓеĵçÍø¸ß¶È½ôÃܵØÜöÝ͵½Ò»ÆðµÄÐÂÐ͵çÍø, ʵÏÖµçÍøµÄ¿É¿¿¡¢Äþ¾²¡¢¾­¼Ã¡¢¸ßЧ¡¢Çé¿öÓѺúÍʹÓÃÄþ¾²µÄÄ¿±ê¡£¿ÉÊÇËæ×ŵçÍøÖÇÄÜ»¯µÄ²»¾øÌá¸ß, ÆäÊý¾ÝÁ¿Ò²ËæÖ®ÒÔÖ¸Êý¼¶µÄÔö³¤¡£Ãæ¶ÔÕ⺣Á¿Êý¾ÝµÄ´æ´¢µÄÄÑÌâ, º£ÄÚÒÑÓеçÁ¦µ÷ÀíϵͳµÄ½¨Éè´ó¶à½ÓÄÉͨÀýµÄ½â¾ö¼Æ»®, ¼´½ÓÄÉÌÚ¹óµÄ´óÐÍЧÀÍÆ÷Ϊ»ù´¡, ͨ¹ý¹Å°åµÄ¹ØϵÊý¾Ý¿âµÄ·½·¨ÖÎÀí, ²¢ÇÒÒÔÊý¾Ý¿â·ÖƬµÄ·½·¨´æ·Åµ½´ÅÅÌÕóÁÐÖеÄÐÎʽ[1]¡£Õâµ¼ÖÂϵͳµÄÀ©Õ¹Éý¼¶½ÏΪÀ§ÄÑ, ÓöÈÊ®·Ö¸ß°º, ÇÒÕû¸öϵͳÄ£¿é¼äñîºÏÐÔ½ÏÇ¿, ÄÑÒÔÂú×ãµçÍøÖÇÄÜ»¯ËùÒªÇóµÄ¸ßЧ¡¢¿É¿¿¡¢¾­¼ÃµÄÄ¿±ê[2]¡£

ÔÆ´æ´¢Äܹ»½â¾öÖÇÄܵçÍø¶Ôº£Á¿Êý¾ÝµÄ´æ´¢µÄÄÑÌâ, ×î´óÏ޶ȵØÕûºÏϵͳµÄ´æ´¢ÄÜÁ¦, ¼õÉÙµçÍøÖÇÄÜ»¯µÄ±¾Ç®, ´ó·ùÌá¸ßÄ¿½ñϵͳµÄÕûÌåÐÔÄÜ, ¶ÔÖÇÄܵçÍøµÄÉú³¤Æðµ½¾Þ´óµÄÍÆÐж¯Óá£ÔÆÅÌËãËäÈ»ÔÚÖÇÄܵçÍø·½Ãæδ¼û³ÉÐ͵Äϵͳ[3,4], µ«ÒѾ­ÔÚÆäËûÁìÓò»ñµÃÁË´ó×ÚµÄÓ¦ÓÃ[7,8], ²¢ÇÒÖÇÄܵçÍø·½ÃæµÄÔÆÅÌËãϵͳҲÔڼܹ¹Éè¼Æ¿ª·¢½×¶ÎÁË[9], ¿ÉÊÇHadoop¼¯ÈºÔÚ´¦ÀíµçÍø´óÊý¾ÝÉϾßÓо޴óµÄÓÅÊÆ[1,12]¡£

1 Hadoop¸ÅÊö

Hadoop×÷Ϊһ¸ö¿ªÔ´µÄÔÆÅÌËã»ù´¡¿ò¼Ü, Ò»¸öÂþÑÜʽϵͳ»ù´¡¼Ü¹¹, ¿ÉÒÔʹÓû§³ä·ÖÀûÓü¯ÈºµÄÍþÁ¦¸ßËÙÔËËãºÍ´æ´¢, ¾ßÓпɿ¿µÄÊý¾Ý´æ´¢ºÍ´¦ÀíÄÜÁ¦¡¢Ò×ÓÚÀ©Õ¹µÄÅÌËã»ú¼¯Èº¡¢ÒÔ¸ßÈÝ´íÐԵĴ󶼾ݸ±±¾¡¢ÒÔÈí¼þ¿ªÔ´¼°Á®¼ÛÅÌËã»ú¼¯Èº´øÀ´µÄµÍ±¾Ç®µÈÓÅÊÆ, Õý³ÉΪÐÅÏ¢ÁìÓòÑо¿µÄÈȵã¡£

HBase (Hadoop Database) , ÊÇÒ»¸öÔÚHDFSϵͳ»ù´¡Éϵĸ߿ɿ¿ÐÔ¡¢¸ßÐÔÄÜ¡¢ÃæÏòÁС¢¿ÉÉìËõµÄÂþÑÜʽNo SQLÊý¾Ý¿â, Êǹȸ蹫˾Big Table¼¼ÊõµÄ¿ªÔ´ÏîÄ¿[15], ÀûÓÃHBase¼¼Êõ¿ÉÔÚÁ®¼ÛPCЧÀÍÆ÷¼¯ÈºÉϴÆð´ó¹æÄ£·Ç¹Øϵ½á¹¹»¯¿ìËÙ¶ÁдµÄ´æ´¢»õ²Ö¡£

Map Reduce×÷Ϊ²¢Ðд¦Àí´óÊý¾Ý¼¯µÄÈí¼þ¿ò¼Ü, ÔÚHadoopÉÏ»ñµÃÁËʵÏÖ[7]¡£ËüÂôÁ¦·ÖÅÉÊÂÇéÒÔ¼°ÓëÓû§³ÌÐò½øÐÐͨÐÅ, ͨ¹ý°Ñ¶ÔÊý¾Ý¼¯µÄ´ó¹æÄ£²Ù×÷·Ö·¢¸øÍøÂçÉϵÄÿ¸ö½ÚµãÉÏ, ʵÏÖÊý¾ÝµÄÂþÑÜʽ´¦Àí¡£

2 ÖÇÄܵçÍøÊý¾ÝÔƴ洢ϵͳÉè¼Æ

ÖÇÄܵçÍøÇé¿öϵçÁ¦Êý¾Ý¾ßÓÐ:¹æÄ£´ó¡¢ÀàÐͶࡢ¼ÛÖµÃܶȵͺͱä¸ï¿ìµÄÌصã[5], ƾ¾ÝÊý¾ÝµÄ±¬·¢Ô´´óÖ·ÖΪÈýÀà:Ò»ÊǵçÍøÔËÐкÍÉ豸¼ì²â»ò¼à²âÊý¾Ý;¶þÊǵçÁ¦ÆóÒµÓªÏúÊý¾Ý, Èç½»Ò×µç¼Û¡¢ÊÛµçÁ¿¡¢Óõç¿Í»§µÈ·½ÃæµÄÊý¾Ý;ÈýÊǵçÁ¦ÆóÒµÖÎÀíÊý¾Ý[5]¡£Òò´ËËæ×Åʱ¼äµÄÔö³¤, ´æ´¢µçÍøÊý¾ÝËùÐèµÄ¿Õ¼ä½«Ô½À´Ô½´ó, ͬÀíÔÚÅÌÎÊÊý¾ÝʱҲ½«¸üΪ·ÑʱÐÁ¿à¡£

ͼ1 Ôƴ洢ϵͳ½á¹¹

ͼ1 Ôƴ洢ϵͳ½á¹¹   


Õë¶ÔÉÏÊöÖÇÄܵçÍøÊý¾ÝµÄÌصã, ½áºÏHbaseÂþÑÜʽÊý¾Ý¿âÏ¡Êè´æ´¢¡¢×Ô¶¯ÇзÖÊý¾Ý¡¢Ìṩ¸ß²¢·¢¶Áд²Ù×÷µÈÌصã, ¹¹½¨³öÖÇÄܵçÍøÊý¾ÝÔƴ洢ϵͳ¡£

Èçͼ1ËùʾΪÔƴ洢ϵͳµÄ½á¹¹Í¼, Õû¸öϵͳÓÉ´æ´¢¿Í»§¶Ë¡¢HadoopЧÀÍÆ÷¼¯Èº¡¢ÅÌÎÊ¿Í»§¶ËÈý²¿·Ö×é³É¡£Êý¾ÝÔ´°üÀ¨ÖÇÄܵçÍøÖеķ¢µç¡¢±äµç¡¢Êäµç¡¢Óõ硢µ÷Àí¡¢ÏúÊÛ¡¢²ÆÎñµÈÊý¾Ý, ÓÉÖÖÖÖ¼à¿ØÖÎÀíÉ豸»òÖն˾­ÓÉÒÔÌ«ÍøµÈÍøÂç´«Êä, ²¢¾­ÓÉ´æ´¢¿Í»§¶Ë´æ´¢µ½¼¯Èºµ±ÖС£ÏµÍ³½¹µãÊÇÒÔ´ó×ÚÁ®¼ÛµÄPC»úΪ»ù´¡, ͨ¹ýHadoopÂþÑÜʽ¿ò¼Ü´î½¨µÄЧÀÍÆ÷¼¯Èº, ÓÉÉÙÁ¿µÄName Node (ÂôÁ¦Î¬»¤ÎļþϵͳÃüÃû¿Õ¼ä) ºÍ´ó×ÚµÄData Node (ÂôÁ¦´æ´¢Êý¾Ý¿é) ×é³É¡£Í¼1×ó±ßÊÇ´æ´¢¿Í»§¶Ë, ÂôÁ¦½«ÉÏ´«µÄÊý¾ÝÓ³Éä³ÉHbaseÊý¾Ý¿âHtable±íÏî, ²¢ÇÒ´æ´¢µ½HbaseÊý¾Ý¿âÖÐ;ÓÒ±ßΪÅÌÎÊЧÀÍÆ÷, ÂôÁ¦´¦Àíº£Á¿Êý¾ÝµÄÅÌÎÊ, ΪÊý¾ÝÆÊÎöÓ¦ÓÃÌṩº£Á¿Êý¾Ý»ù´¡¡£

2.1 ¼¯Èº´î½¨¼°Hbase±íÉè¼Æ

ͨ¹ýÐéÄ⻯¼¼Êõ, ÔÚ×°ÖÃWindows 7²Ù×÷ϵͳµÄPC»úÉÏ, ×°ÖÃVMware Workstation 10, ÐéÄâLinuxÇé¿ö, ÐγÉÒ»¸ö´¦ÓÚ10.10.11.0¶ÎµÄ¾ÖÓòÍøÂç¡£ÔÚ¸÷»úÉÏ×°ÖÃJDK¡¢SSH¡¢Hadoop-0.20.2ÒÔ¼°Hbase-0.90.5, Íê³É´î½¨Ò»¸öÍêÈ«ÂþÑÜģʽϵÄHadoop¼¯Èº, ×îºóÔÙÔÚ¸÷»úÉÏ×°ÖÃZookeeper-3.3.4À´ÖÎÀíHadoop¼¯Èº¡£

´´Á¢Hbase±íʱÐèҪȷ¶¨±íµÄ½á¹¹ºÍ±íµÄÊôÐÔ¡£±íµÄ½á¹¹ÓÐÈýÖÖ»ù±¾ÀàÐÍ°üÀ¨:ÐÐÒªº¦×Ö (Row Key) ¡¢Ê±¼ä´Á (Time Stamp) ºÍÁÐ×å (Column Family) ¡£ÆäÖÐÐÐÒªº¦×ÖÓÉÓû§ID (ÀàÐÍΪ32λ¶þ½øÖÆ) ¡¢Êý¾Ý´æÈëʱ¼ä (DatatimeÀàÐÍ) ¡¢Êý¾ÝÀàÐÍ (StringÀàÐÍ) ¡¢Êý¾ÝÐÐID (ÀàÐÍ64λ¶þ½øÖÆ) Ëĸö²¿·Ö×é³ÉµÄ×Ö½ÚÊý×é, ÓÉRow KeyÉú²úÆ÷Éú³É¡£Ê±¼ä´Áƾ¾ÝÊäÈëÊý¾ÝµÄʱ¼ä´Á¶ø¶¨, ÈôÊý¾ÝΪ¾²Ì¬Êý¾Ý×Ô¼ºÎÞʱ¼ä´ÁÔòÓÉ´æÈëÊý¾Ý¿âʱ¼äΪʱ¼ä´ÁµÄÖµ¡£ÁÐ×å, ÀûÓÃÆäÏ¡ÊèºÍ¶¯Ì¬´´Á¢ÁеÄÌØÐÔ, ƾ¾ÝÊäÈëÎļþÃèÊöµÄ¹¤¾ß¶¯Ì¬´´Á¢Áв¢ÇÒ°ÑÊý¾Ý´æµ½¶ÔÓ¦ÁÐÖС£¶ø±íµÄÊôÐÔÖ÷ÒªÓõ½µÄÓÐ:Êý¾ÝÐÐ×î´ó°æ±¾Êý, Hbaseͨ¹ý±£´æ¾É°æ±¾ÒÔÔ¤·ÀÎó²Ù×÷, ÔÚÕâÓÉÓÚÊý¾Ý±»Ð޸ĵĿÉÄÜÐÔ½ÏС¹ÊÉèΪ3;ѹËõËã·¨, ʹÓÃsnappyËã·¨, ÆäѹËõЧÂÊÓëlzoÏà½üµ«½âѹЧÂÊÔ¶¸ßÓÚIzo, ʹÊý¾ÝÅÌÎÊËٶȼÓËÙ¡£

2.2 ´æ´¢¿Í»§¶ËÉè¼Æ

ʵÑéÒÔµ÷ÀíϵͳÏòÔƴ洢ϵͳ½øÐÐÊý¾ÝÉÏ´«ÎªÀý, ½«Ò»Ì¨PC»ú×÷Ϊµ÷ÀíϵͳÊý¾Ý±¬·¢¶Ë, ½«Âú×ã¹ú±êDLT890[12]±ê×¼ (ת»¯×ÔIECϵÁбê×¼) [6,11]µÄÊý¾ÝÉÏ´«µ½¼¯Èº¡£ÆäÖÐÊý¾Ý°üÀ¨Á˵ØÓß (GIS) ÐÅÏ¢¡¢µçÁ¦É豸ºÍÏß·ÐÅÏ¢¡¢²ÆÎñÐÅÏ¢¡¢¸ºÔØÐÅÏ¢¡¢Á¿²âÐÅÏ¢¡¢µçÁ¦±£»¤ÐÅÏ¢¡¢É豸´¢±¸ÓëËðºÄÐÅÏ¢¡¢Ô¤²â¼°¼Æ»®ÐÅÏ¢µÈ[14], ÕâЩÐÅÏ¢Êý¾ÝÒÔͨÓÃÐÅϢģÐͼ°ÆäÍØչģÐÍΪģ°åÐγÉ, ²¢ÇÒͨ¹ýRDF (Resource Description Framework) ÍøÂç×ÊÔ´ÃèÊöÓïÑÔ[10]µÄ·½·¨ÃèÊö, Èçͼ2Ëùʾ¡£

ÔÚʵÑéÀï, ´æ´¢¿Í»§¶Ëƾ¾ÝÓû§ÐÅÏ¢ºÍÏà¹ØÅäÖÃÐÅÏ¢´´Á¢ÅäÖÃÐÅÏ¢²¢ÇÒ³õʼ»¯Row Key¹¤³§ÒÔ¼°´´Á¢Êý¾ÝÐÐÉÏ´«»º³åÇøHTable Pool, È»ºó½«ÉÏ´«ÎļþÖеÄÊý¾ÝÓ³ÉäΪÊý¾ÝÐдæ·Åµ½ÉÏ´«»º³åÇøÖÐ, µ±»º³åÇø´æ·ÅµÄÊý¾ÝÐеִïÒ»¶¨µÄÐÐÊýÔÙÌύʵÐÐÏ¡ÊèµÄ´ÅÅÌ´æ´¢, Èç±í1Ëùʾ, ÇÒÊý¾ÝÏîÖпÉÒÔº¬ÓпյÄÁÐÏî, ²¢ÇÒΪ¿ÕµÄÊý¾ÝÏî²»Õ¼ÓÃÈκδ洢¿Õ¼ä¡£ÓÉÓÚHTableÊÇÓÐÐòµÄÇÒHbase¾ßÓÐ×Ô¶¯ÇзÖÊý¾ÝµÄÄÜÁ¦, ¹ÊÖ»Ðè¿ØÖÆ´æ´¢Êý¾ÝÐеÄRow Key²»Á¬ÐøµÝÔö, ¾ÍÄÜ°ÑÊý¾ÝÐоùÔȵĴ浽¼¯Èº»úеÉÏ, ¼á³Ö»úе¸ºÔصľùºâ, ÖÆÖ¹ÁËÐÂÊý¾ÝÔú¶Ñ´æ´¢µ½ÏàͬµÄ»úеÉϽµµÍÕû¸ö´æ´¢ÏµÍ³µÄI/OÐÔÄܵÄÏÖÏó¡£

ͼ2 ÖÇÄܵçÍøCIM/RDFÊý¾Ý

ͼ2 ÖÇÄܵçÍøCIM/RDFÊý¾Ý  


ÉÏÊöÊý¾ÝÉÏ´«µÄÏêϸÀú³ÌÈçͼ3Ëùʾ, ÆäÖÐÉÏ´«»º³åÇøͨ¹ýHTable PoolÀà¶ÔÉÏ´«µÄÊý¾ÝÐнøÐлº³åºÍÖÎÀí, ³ý´ËÖ®Íâͨ¹ý½¨Á¢ÉÏ´«ÎļþÁ÷ÐÐÁÐʵÏÖÓû§µÄ¶àÎļþÉÏ´«²Ù×÷¡£

2.3 ÅÌÎÊ¿Í»§¶ËÉè¼Æ

HbaseÇáÁ¿»¯µØ¼¯³ÉÁËHadoopÖеÄMap Reduce²¢ÐÐÔËËãÄ£ÐÍ[9], ²¢ÇÒƾ¾Ý×ÔÉíµÄÌصãÍ»³öÓÅ»¯ÁËÆä±íÅÌÎʵÄЧÂÊÒÔ¼°Ìá³öÁË»ùÓÚMap ReduceµÄ±íÅÌÎʺ¯Êý¡£Òò´ËÓû§ÔÚÅÌÎÊʱÖ÷ÒªÉè¼ÆµÄÊÇTable Input Format¡¢Table Mapper¡¢Table Reducer¡¢Table Output FormatËĸöº¯Êý[8], ÆäÕûÌåÅÌÎÊÀú³ÌÈçͼ4Ëùʾ¡£

1) Table Input Formatº¯Êý, ÂôÁ¦½«Êý¾ÝÒÔ±íµÄÐÎʽͨ¹ý±íÖ§½â³ÉΪSplits, È»ºóÌá½»¸øMapº¯Êý¡£

2) Table Mapperº¯Êý, ÂôÁ¦´¦ÀíTable Input Formatº¯ÊýÌá½»µÄSplits, ÅäÖÃRow KeyÖµµÄ¹æÄ£¡¢¸ÃÊý¾ÝÏîµÄ°æ±¾¡¢¹ýÂËÆ÷µÈÉèÖÃ, È·¶¨Ãü¾Ý²éÕÒµÄÌõ¼þ²¢´´Á¢É¨Ãè¶ÁÈ빤¾ßScan, ×îºó½«ÅÌÎʵ½µÄÊý¾Ý½»¸øTable Reducerº¯Êý¡£

3) Table Reducerº¯Êý, ÂôÁ¦¶ÔÅÌÎʵ½µÄÊý¾Ý½øÐÐÆÊÎö´¦Àí¡£ÊµÑéÖÐÓÉÓÚÎÞÌØÊâÓ¦ÓÃÐèÇó, Ö»¶ÔÅÌÎÊÊý¾Ý½øÐÐÁËÅÅÐò, Ìá½»µ½Table Output Formatº¯Êý¡£

4) Table Reducer¸öÊýÅäÖÃ, ͨ¹ýÅäÖÃTable Reducer¸öÊýÄܹ»µ÷ÀíH a d o o p¼¯ÈºµÄ¸ºÔØÒÔ¼°¸ÃMap ReduceÈÎÎñµÄ´¦ÀíËÙ¶È, Table Reducer¸öÊýÔںܺéÁ÷ƽÉÏÓ°ÏìÕû¸öMap ReduceÈÎÎñµÄЧÂÊ¡£

5) Table OutputFormatº¯Êý, ³ýÁ˸ºÔØ»ã×ÜTable Reducerº¯Êý´¦ÀíÍêµÄÊý¾ÝÒÔÍâ, »¹ÌṩÁ˵ײãˢеĻúÖÆ, ´ó´óµØÔö¼ÓÁË´ó×ÚÊý¾ÝÔÚÏà½çÃæ·ºÆðʱµÄËٶȡ£

  

±í1 HbaseÊý¾ÝÐÐ



±í1 HbaseÊý¾ÝÐÐ

3 ʵÑéÓë½á¹ûÆÊÎö

ͼ3 ´æ´¢Àú³Ì

ͼ3 ´æ´¢Àú³Ì   


ͼ4 ÅÌÎÊÀú³Ì

ͼ4 ÅÌÎÊÀú³Ì 


3.1 ʵÑéƽ̨Çé¿ö

±¾ÎĵÄËùÓÐʵÑé¾ùÔÚʵÑéÊҴµÄHadoopƽ̨ÉÏÔËÐС£Æ½Ì¨ÓÐ9¸ö½Úµã×é³É, ¾ùΪÁ®¼ÛPC»ú, ÿ¸ö½ÚµãµÄÎïÀíÅäÖÃΪ˫ºËCPU, Ö÷ƵΪ2.0MHz, ÄÚ´æΪ2G, ÍøÂç´ø¿í100Mbps¾ÖÓòÍø, Ó²ÅÌΪ100G, Hadoop°æ±¾Îª0.20.205, Hbase°æ±¾Îª0.90.5, Êý¾ÝÐÐ×î´ó°æ±¾ÊýΪ3¡£

3.2 Êý¾ÝÅÌÎÊÐÔÄÜÆÊÎö

ʵÑéÊÇÔÚ¼¯ÈºÎÞÆäËûÈÎÎñµÄÌõ¼þÏÂ, ʹÓòâÊÔ¿Í»§¶ËÒÔ²î±ðµÄÅäÖòâÊÔHbaseµÄI/OÐÔÄÜ, ÒÔ»ñµÃHbaseµÄI/OÐÔÄÜ×îÓÅʱHbaseµÄÅäÖá£ÆäÖÐÓ°ÏìHbaseµÄI/OÐÔÄܵÄÖ÷ÒªÒòËØÊÇÒªÔÚ¼¯ÈºÉÏ¿ª¼¸¶à¸ö²¢Ðнø³ÌÀ´´¦ÀíÅÌÎʺÍÆÊÎö´¦ÀíÈÎÎñ¡£

1) ʵÑéÖÐÖ»¸Ä±äMap ReduceµÄ²¢Ðнø³Ì¸öÊý (¼´¸Ä±äÿ¸öInput SplitµÄ¾Þϸ) , ¼á³ÖÆäËûÌõ¼þÎȶ¨, ´´Á¢ÅÌÎÊ170ÍòÐÐÊý¾ÝµÄÈÎÎñ²¢»ñÈ¡ÈÎÎñÔËÐÐʱ¼ä, ½á¹ûÈçͼ5Ëùʾ¡£

ͼ5 Map Reduce¸öÊý¶ÔHbaseÐÔÄܵÄÓ°Ïì

ͼ5 Map Reduce¸öÊý¶ÔHbaseÐÔÄܵÄÓ°Ïì   


2) ¿ØÖÆMap ReduceµÄ²¢Ðнø³Ì¸öÊý (MapºÍReduceÈÎÎñ¾ùΪ18¸ö) ¼°ÆäËûÌõ¼þÎȶ¨, Ö»¸Ä±äÅÌÎÊÊý¾ÝÐеÄÊýÁ¿, ´Ó10ÍòÐе½350ÍòÐÐ, ²¢»ñÈ¡ÈÎÎñÔËÐÐʱ¼ä, ½á¹ûÈçͼ6Ëùʾ¡£

ͼ6 Êý¾Ý´¦ÀíÁ¿¶ÔHbaseÐÔÄܵÄÓ°Ïì

ͼ6 Êý¾Ý´¦ÀíÁ¿¶ÔHbaseÐÔÄܵÄÓ°Ïì  


ÓÉÉÏÊöÁ½×éʵÑé¿ÉÒÔ¿´³ö, ÿ¸öMap ReduceÈÎÎñµÄ²¢Ðнø³Ì¸öÊýÌ«ÉÙʱ¼¯Èº×ÊԴûÓóä·ÖµØÀûÓÃÅÌÎÊËٶȽµµÍ;¶ø²¢Ðнø³Ì¸öÊýÌ«¶àʱ, ËäÈ»Êý¾Ý´¦ÀíµÄËÙ¶ÈÓÐËùÔö¼Ó, µ«È´ÀË·ÑÁË´ó×ÚµÄʱ¼äÔÚ½ø³Ì´´Á¢ºÍ½ÚµãͨѶÉÏ, ·´¶øµÃ²»³¥Ê§;³ý´ËÖ®ÍâÈç¹ûÿ¸ö½ø³Ì´¦ÀíµÄÊý¾Ý¹ý¶à»á´ó×ÚÕ¼ÓýڵãÄÚ´æ, µ¼Ö¸ýڵãÎÞ·¨´¦Àí±ðµÄ½ø³Ì, ½µµÍÁËЧÂÊ¡£Òò´Ëƾ¾ÝÉÏÊöÁ½¸öʵÑéµÃ³öÔÚ¼¯ÈºÓÃ18¸ö½ø³ÌÇÒÿ¸ö½ø³ÌÉúÃüÖÜÆÚΪ20Ãë (¼´´¦ÀíÔ¼170ÐÐÊý¾Ý) ʱ»ñµÃ½ÏºÃµÄЧÂÊ¡£¹Ê¹ØÓÚ±¾¼¯Èº, Map ReduceµÄ²¢Ðнø³Ì¸öÊýÓ¦ÉèÖÃΪ[ÅÌÎÊÊý¾ÝÐÐÊý/90000]+1¡£ÕâÑùÉèÖÃËäÈ»ÎþÉüÁ˼¯ÈºµÄС²¿·ÖÈÎÎñ´¦ÀíËÙ¶È, ¿ÉÊÇȴʹ¼¯ÈºÔÚ¶àÈÎÎñ¸ß¸ºÔØÔËÐÐÏ°ü¹Üÿ¸öÈÎÎñµÄ´¦ÀíËٶȡ£

3.3 Êý¾Ý¶ÁдÐÔÄܱȽÏ

ʵÑéÊÇÔÚ¼¯ÈºÎÞÆäËüÈÎÎñÔËÐÐÇÒMap ReduceÅäÖÃÏàͬµÄÌõ¼þÏÂ, ʹÓòâÊÔ¿Í»§¶Ë¶ÔHbase½øÐÐдÈëÊý¾ÝºÍÅÌÎÊÊý¾Ý, ½«Í¬ÑùµÄÊý¾Ý·Åµ½Oracleϵͳ (ËĺËCPU, 8GBÄÚ´æ, Ó²ÅÌ650GB) ÀïÅÌÎʲ¢Í³¼Æʱ¼ä¡£

  

±í2 OracleÓëHbaseÅÌÎÊʱ¼ä±ÈÕÕ±í 



±í2 OracleÓëHbaseÅÌÎÊʱ¼ä±ÈÕÕ±í

ÓÉÉϱí2¿ÉÒÔ¿´³ö, µ±Êý¾ÝÁ¿µÍÓÚ80ÍòÐÐʱ, µ¥»úЧÀ͵ĹŰåOracleÊý¾Ý¿âÓкܴóµÄÓÅÊÆ;¿ÉÊÇËæ×ÅÅÌÎÊÊý¾ÝÁ¿µÄÔö´ó, ¼¯ÈºHbaseÊý¾Ý¿âµÄÓÅÊÆÔ½À´Ô½Ã÷ÏÔ¡£¿ÉÊǵ±ÔÚ´ó×ÚÊý¾ÝÈë¿âʱ, Á½ÖÖÊý¾Ý¿âϵͳдÈëËٶȶ¼²»Ì«ÀíÏë, ²»¹ýÕë¶ÔÕâÒ»ÎÊÌâ, HbaseÒ²ÌṩÁËÒ»ÖÖÓëÊý¾Ý¿âÎļþµ¼ÈëÀàËƵÄÒÔHfile (ƾ¾ÝHbaseÊý¾Ý»¨Ñù´æ´¢µÄÎļþ»¨Ñù) µÄ·½·¨Èë¿â, ÆäдÈëËÙ¶ÈÓëHDFSËÙ¶ÈÒ»Ñù[13], ²¢ÇÒÔÚÎļþ»¨Ñùת»»Ê±, »¹ÄÜͨ¹ýMap ReduceµÄ·½·¨ÀûÓü¯ÈºµÄÕûÌåÐÔÄÜ¿ìËٵؽ«Êý¾Ýת»»ÎªHfile¡£×ÛÉÏ, ¸Ã¼¯ÈººÜÊÇÊʺϴ洢´ó¹æÄ£µÄ´æ´¢´ÎÊýƵ·±µ«Ã¿´ÎÊý¾ÝÁ¿Î´¼¸µÄÖÇÄܵçÍø´óÊý¾Ý, ÇÒÔÚµçÍø´óÊý¾Ý´¦ÀíÉϾßÓпìËÙ¡¢¿É¿¿¡¢Á®¼ÛµÄÓÅÊÆ¡£

4 ½áÂÛ

±¾ÎÄÑо¿ÁË»ùÓÚHadoopµÄÖÇÄܵçÍøÊý¾ÝÔƴ洢ϵͳ, Ê×ÏÈÆÊÎöÖÇÄܵçÍøÊý¾ÝµÄÌصã, ÀûÓÃHbaseÂþÑÜʽÊý¾Ý¿âµÄÌصã, Éè¼Æ²¢ÊµÏÖÁËÖÇÄܵçÍøÊý¾ÝÔƴ洢ϵͳ¡£´î½¨Á˾ßÓÐ9¸ö½ÚµãµÄÁ®¼ÛPC»ú×é³ÉµÄHadoop¼¯Èº, È»ºó¿ª·¢ÁË»ùÓÚHbaseÒÔ¼°Map ReduceµÄ´æ´¢ºÍÅÌÎÊ¿Í»§¶Ë, ²¢ÇÒ¶Ô¼¯Èº½øÐÐÁË´ó×ÚµÄʵÑé, °üÀ¨Map ReduceÅäÖÃʵÑéºÍÓëHDFSÐÔÄܱȽÏʵÑé, ±êÃ÷Á˱¾¼¯ÈºÊʺÏÓ¦ÓÃÓÚÖÇÄܵçÍø´óÊý¾ÝµÄ´æ´¢, ²¢ÇÒÌṩÁË¿ìËÙ´¦Àí´óÊý¾ÝµÄÄÜÁ¦, ÔÚÐÐÒµµçÍøÊý¾ÝÆÊÎöÖоßÓпìËÙ¡¢ÓÐЧ¡¢¿É¿¿¡¢Á®¼ÛµÄÓÅÊÆ¡£


¡¾±¾ÎıêÇ©¡¿

¡¾ÔðÈα༭¡¿yd2333Ôƶ¥µç×ÓÓÎÏ·ÔƲÖ

×îÐÂ×ÊѶ

ÍøÕ¾µØͼ
ÓÑÇéÁ´½Ó£º918²©ÌìÌà Áú8Ψһ¹ÙÍø  yd2333Ôƶ¥µç×ÓÓÎÏ·  ±ØÒ»Ô˶¯  918²©ÌìÌà ÍþÁ®Ï£¶û  9Óλá¹ÙÍø  ÀûÀ´¹ú¼Êag  w88Óŵ¹ÙÍø  Ç§ÒÚÇòÓѻᠠag×ðÁúƽ̨  bbin±¦Ó¯  UG»·Çò¹ÙÍø  3377ÌåÓý  ½ðÄê»á