ÀÖÓãµç¾º

  • ½ÌÓýÐÐÒµA¹ÉIPOµÚÒ»¹É£¨¹ÉƱ´úÂë 003032£©

    È«¹ú×Éѯ/ͶËßÈÈÏߣº400-618-4000

    RDDÔÚSparkÖÐÊÇÈçºÎÔËÐеÄ£¿

    ¸üÐÂʱ¼ä:2021Äê06ÔÂ17ÈÕ10ʱ49·Ö À´Ô´:ÀÖÓãµç¾º ä¯ÀÀ´ÎÊý:

    ÀÖÓãµç¾º-Ò»ÑùµÄ½ÌÓý£¬²»Ò»ÑùµÄÆ·ÖÊ

    ÏÂÃæ£¬Í¨¹ýÒ»ÕÅͼÀ´Ñ§Ï°Ò»ÏÂRDDÔÚSparkÖÐÔËÐÐÁ÷³Ì£¬Èçͼ1Ëùʾ¡£

    RDDÔÚSparkÖеÄÔËÐÐÁ÷³Ì

    ͼ1 RDDÔÚSparkÖеÄÔËÐÐÁ÷³Ì


    ÔÚͼ1ÖУ¬£¬SparkµÄÈÎÎñµ÷¶ÈÁ÷³Ì·ÖΪRDD Objects¡¢DAGScheduler¡¢TaskSchedulerÒÔ¼°WorkerËĸö²¿·Ö¡£¹ØÓÚÕâËĸö²¿·ÖµÄÏà¹Ø½éÉܾßÌåÈçÏ£º

    (1)RDD Objects£ºµ±RDD¶ÔÏó´´½¨ºó£¬SparkContext»á¸ù¾ÝRDD¶ÔÏó¹¹½¨DAGÓÐÏòÎÞ»·Í¼£¬È»ºó½«TaskÌá½»¸øDAGScheduler¡£

    (2)DAGScheduler£º½«×÷ÒµµÄDAG»®·Ö³É²»Í¬µÄStage£¬Ã¿¸öStage¶¼ÊÇTaskSetÈÎÎñ¼¯ºÏ£¬²¢ÒÔTaskSetΪµ¥Î»Ìá½»¸øTaskScheduler¡£

    (3)TaskScheduler£ºÍ¨¹ýTaskSetManager¹ÜÀíTask£¬²¢Í¨¹ý¼¯ÈºÖеÄ×ÊÔ´¹ÜÀíÆ÷£¨StandaloneģʽÏÂÊÇMaster£¬YarnģʽÏÂÊÇResourceManager£©°ÑTask·¢¸ø¼¯ÈºÖÐWorkerµÄExecutor¡£ÈôÆÚ¼äÓÐij¸öTaskʧ°Ü£¬ÔòTaskScheduler»áÖØÊÔ£»ÈôTaskScheduler·¢ÏÖij¸öTaskһֱûÓÐÔËÐÐÍê³É£¬ÔòÓпÉÄÜÔÚ¿ÕÏеĻúÆ÷ÉÏÆô¶¯Í¬Ò»¸öTask£¬ÄĸöTaskÏÈÍê³É¾ÍÓÃÄĸöTaskµÄ½á¹û¡£µ«ÊÇ£¬ÎÞÂÛTaskÊÇ·ñ³É¹¦£¬TaskScheduler¶¼»áÏòDAGScheduler»ã±¨µ±Ç°µÄ״̬£¬Èôij¸öStageÔËÐÐʧ°Ü£¬ÔòTaskScheduler»á֪ͨDAGSchedulerÖØÐÂÌá½»Task¡£ÐèҪעÒâµÄÊÇ£¬Ò»¸öTaskSchedulerÖ»ÄÜ·þÎñÒ»¸öSparkContext¶ÔÏó¡£Worker£ºSpark¼¯ÈºÖеÄWorker½ÓÊÕµ½Taskºó£¬°ÑTaskÔËÐÐÔÚExecutor½ø³ÌÖУ¬Õâ¸öTask¾ÍÏ൱ÓÚExecutorÖнø³ÌÖеÄÒ»¸öÏ̡߳£Ò»¸ö½ø³ÌÖпÉÒÔÓжà¸öÏß³ÌÔÚ¹¤×÷£¬´Ó¶ø¿ÉÒÔ´¦Àí¶à¸öÊý¾Ý·ÖÇø£¨ÀýÈçÔËÐÐÈÎÎñ¡¢¶ÁÈ¡»òÕß´æ´¢Êý¾Ý£©¡£









    ²ÂÄãϲ»¶£º

    RDDÈÝ´í»úÖÆ£¿RDDÊÇÈçºÎ»Ö¸´Êý¾ÝµÄ£¿

    ÔõÑùʹÓÃSpark·½·¨Íê³ÉRDDµÄ´´½¨£¿

    RDDΪʲôҪ½øÐÐÊý¾Ý³Ö¾Ã»¯£¿³Ö¾Ã»¯²Ù×÷²½Öè

    spark±Ê¼ÇÖ®RDDÈÝ´í»úÖÆÖ®checkpoint

    ÀÖÓãµç¾ºPython+´óÊý¾Ý¿ª·¢Åàѵ

    0 ·ÖÏíµ½£º
    ºÍÎÒÃÇÔÚÏß½»Ì¸£¡
    ¡¾ÍøÕ¾µØÍ¼¡¿¡¾sitemap¡¿