ÀÖÓãµç¾º

½ÌÓýÐÐÒµA¹ÉIPOµÚÒ»¹É£¨¹ÉƱ´úÂë 003032£©

È«¹ú×Éѯ/ͶËßÈÈÏߣº400-618-4000

SparkµÄ¿íÕ­ÒÀÀµÊÇʲôÒâ˼?

¸üÐÂʱ¼ä:2023Äê12ÔÂ07ÈÕ10ʱ30·Ö À´Ô´:ÀÖÓãµç¾º ä¯ÀÀ´ÎÊý:

ºÃ¿Ú±®ITÅàѵ

¡¡¡¡ÔÚSparkÖУ¬¿íÕ­ÒÀÀµ(Wide vs Narrow Dependency)Ö¸µÄÊÇ×÷Òµ(Job)Öв»Í¬RDD(Resilient Distributed Dataset)Ö®¼äµÄÒÀÀµ¹ØÏµÀàÐÍ¡£

¡¡¡¡1.Õ­ÒÀÀµ(Narrow Dependency)£º

¡¡¡¡£¨1£©µ±¸¸RDDµÄÿ¸ö·ÖÇø½ö±»Ò»¸ö×ÓRDDµÄ¶ÔÓ¦·ÖÇøËùʹÓÃʱ£¬¾Í´æÔÚÕ­ÒÀÀµ¡£

¡¡¡¡£¨2£©Õ­ÒÀÀµ·¢ÉúÔÚÒ»¶ÔÒ»µÄת»»²Ù×÷£¬±ÈÈçmap¡¢filterµÈ¡£ÕâÒâζ×Åÿ¸ö¸¸RDDµÄ·ÖÇøÖ»»á±»ÓÃÓÚ¼ÆËãÉú³ÉÒ»¸ö×ÓRDDµÄ¶ÔÓ¦·ÖÇø£¬²»»á·¢ÉúÊý¾ÝµÄshuffle(ÖØÐ·ÖÅäÊý¾Ý)¡£

¡¡¡¡£¨3£©ÒòΪûÓÐÊý¾ÝµÄÖØÐ·ַ¢£¬Õ­ÒÀÀµµÄ²Ù×÷ЧÂʸߣ¬²»ÐèÒªÍøÂç´«ÊäÊý¾Ý£¬¶øÊÇÔÚͬһ¸ö½ÚµãÉϽøÐмÆËã¡£

SparkµÄ¿íÕ­ÒÀÀµÊÇʲô

¡¡¡¡2.¿íÒÀÀµ(Wide Dependency)£º

¡¡¡¡£¨1£©µ±¸¸RDDµÄÒ»¸ö»ò¶à¸ö·ÖÇø±»¶à¸ö×ÓRDDµÄ·ÖÇøËùʹÓÃʱ£¬¾Í´æÔÚ¿íÒÀÀµ¡£

¡¡¡¡£¨2£©¿íÒÀÀµÍ¨³£·¢ÉúÔÚ»áÒýÆðÊý¾ÝshuffleµÄ²Ù×÷£¬±ÈÈçgroupByKey¡¢reduceByKeyµÈÐèÒªÊý¾ÝÖØÐ·ÖÇøµÄ²Ù×÷¡£

¡¡¡¡£¨3£©Êý¾ÝµÄÖØÐ·ÖÇø¿ÉÄÜÐèÒª¿ç½ÚµãµÄÍøÂç´«Ê䣬ÒòΪͬһ¸ö¸¸RDDµÄ·ÖÇøÊý¾ÝÒª±»¶à¸ö×ÓRDDµÄ·ÖÇøËùʹÓã¬Õâ»á´øÀ´ÐÔÄÜÉϵĿªÏú¡£

¡¡¡¡Õ­ÒÀÀµºÍ¿íÒÀÀµÖ®¼äµÄÇø±ðÔÚÓÚÊý¾ÝµÄ·ÖÇøÒÔ¼°ÊÇ·ñÐèÒªÔÚ²»Í¬½ÚµãÖ®¼ä½øÐÐÊý¾Ý´«Êä¡£SparkÓÅ»¯»á¾¡¿ÉÄܼõÉÙ¿íÒÀÀµµÄ³öÏÖ£¬ÒòΪËüÃÇ¿ÉÄܵ¼ÖÂÐÔÄÜϽµ£¬ÓÈÆäÊÇÔÚÉæ¼°´ó¹æÄ£Êý¾Ýshuffleʱ¡£

¡¡¡¡Ê¹ÓÃÕ­ÒÀÀµµÄת»»²Ù×÷Äܹ»¹¹½¨¸ü¸ßЧµÄ×÷ÒµÖ´Ðмƻ®£¬ÒòΪËüÃǼõÉÙÁËÊý¾ÝÒÆ¶¯ºÍÍøÂ翪Ïú¡£Òò´Ë£¬ºÏÀíµØÉè¼ÆSpark×÷ÒµÖеÄת»»²Ù×÷£¬±ÜÃâ¿íÒÀÀµµÄ³öÏÖ£¬ÓÐÖúÓÚÌá¸ß×÷ÒµµÄÐÔÄܺÍÖ´ÐÐЧÂÊ¡£

0 ·ÖÏíµ½£º
ºÍÎÒÃÇÔÚÏß½»Ì¸£¡
¡¾ÍøÕ¾µØÍ¼¡¿¡¾sitemap¡¿