.. SPDX-License-Identifier: GPL-2.0
.. include:: ../disclaimer-zh_CN.rst

:Original: Documentation/scheduler/schedutil.rst

:ç¿»è¯‘:

  å”è‰ºèˆŸ Tang Yizhou <tangyeechou@gmail.com>

=========
Schedutil
=========

.. note::

   æœ¬æ–‡æ‰€æœ‰å†…å®¹éƒ½å‡è®¾é¢‘çŽ‡å’Œå·¥ä½œç®—åŠ›ä¹‹é—´å˜åœ¨çº¿æ€§å…³ç³»ã€‚æˆ‘ä»¬çŸ¥é“è¿™æ˜¯æœ‰ç‘•ç–µçš„ï¼Œ
   ä½†è¿™æ˜¯æœ€å¯è¡Œçš„è¿‘ä¼¼å¤„ç†ã€‚

PELTï¼ˆå®žä½“è´Ÿè½½è·Ÿè¸ªï¼ŒPer Entity Load Trackingï¼‰
==============================================

é€šè¿‡PELTï¼Œæˆ‘ä»¬è·Ÿè¸ªäº†å„ç§è°ƒåº¦å™¨å®žä½“çš„ä¸€äº›æŒ‡æ ‡ï¼Œä»Žå•ä¸ªä»»åŠ¡åˆ°ä»»åŠ¡ç»„åˆ†ç‰‡åˆ°CPU
è¿è¡Œé˜Ÿåˆ—ã€‚æˆ‘ä»¬ä½¿ç”¨æŒ‡æ•°åŠ æƒç§»åŠ¨å¹³å‡æ•°ï¼ˆExponentially Weighted Moving Averageï¼Œ
EWMAï¼‰ä½œä¸ºå…¶åŸºç¡€ï¼Œæ¯ä¸ªå‘¨æœŸï¼ˆ1024usï¼‰éƒ½ä¼šè¡°å‡ï¼Œè¡°å‡é€ŸçŽ‡æ»¡è¶³y^32 = 0.5ã€‚
ä¹Ÿå°±æ˜¯è¯´ï¼Œæœ€è¿‘çš„32msè´¡çŒ®è´Ÿè½½çš„ä¸€åŠï¼Œè€ŒåŽ†å²ä¸Šçš„å…¶å®ƒæ—¶é—´åˆ™è´¡çŒ®å¦ä¸€åŠã€‚

å…·ä½“è€Œè¨€ï¼š

  ewma_sum(u) := u_0 + u_1*y + u_2*y^2 + ...

  ewma(u) = ewma_sum(u) / ewma_sum(1)

ç”±äºŽè¿™æœ¬è´¨ä¸Šæ˜¯ä¸€ä¸ªæ— é™å‡ ä½•çº§æ•°çš„ç´¯åŠ ï¼Œç»“æžœæ˜¯å¯ç»„åˆçš„ï¼Œå³ewma(A) + ewma(B) = ewma(A+B)ã€‚
è¿™ä¸ªå±žæ€§æ˜¯å…³é”®ï¼Œå› ä¸ºå®ƒæä¾›äº†åœ¨ä»»åŠ¡è¿ç§»æ—¶é‡æ–°ç»„åˆå¹³å‡æ•°çš„èƒ½åŠ›ã€‚

è¯·æ³¨æ„ï¼Œé˜»å¡žæ€çš„ä»»åŠ¡ä»ç„¶å¯¹ç´¯åŠ å€¼ï¼ˆä»»åŠ¡ç»„åˆ†ç‰‡å’ŒCPUè¿è¡Œé˜Ÿåˆ—ï¼‰æœ‰è´¡çŒ®ï¼Œè¿™åæ˜ äº†
å®ƒä»¬åœ¨æ¢å¤è¿è¡ŒåŽçš„é¢„æœŸè´¡çŒ®ã€‚

åˆ©ç”¨è¿™ä¸€ç‚¹ï¼Œæˆ‘ä»¬è·Ÿè¸ª2ä¸ªå…³é”®æŒ‡æ ‡ï¼šâ€œè¿è¡Œâ€å’Œâ€œå¯è¿è¡Œâ€ã€‚â€œè¿è¡Œâ€åæ˜ äº†ä¸€ä¸ªè°ƒåº¦å®žä½“
åœ¨CPUä¸ŠèŠ±è´¹çš„æ—¶é—´ï¼Œè€Œâ€œå¯è¿è¡Œâ€åæ˜ äº†ä¸€ä¸ªè°ƒåº¦å®žä½“åœ¨è¿è¡Œé˜Ÿåˆ—ä¸èŠ±è´¹çš„æ—¶é—´ã€‚å½“åªæœ‰
ä¸€ä¸ªä»»åŠ¡æ—¶ï¼Œè¿™ä¸¤ä¸ªæŒ‡æ ‡æ˜¯ç›¸åŒçš„ï¼Œä½†ä¸€æ—¦å‡ºçŽ°å¯¹CPUçš„äº‰ç”¨ï¼Œâ€œè¿è¡Œâ€å°†å‡å°‘ä»¥åæ˜ æ¯ä¸ª
ä»»åŠ¡åœ¨CPUä¸ŠèŠ±è´¹çš„æ—¶é—´ï¼Œè€Œâ€œå¯è¿è¡Œâ€å°†å¢žåŠ ä»¥åæ˜ äº‰ç”¨çš„æ¿€çƒˆç¨‹åº¦ã€‚

æ›´å¤šç»†èŠ‚è§ï¼škernel/sched/pelt.c


é¢‘çŽ‡ / CPUä¸å˜æ€§
================

å› ä¸ºCPUé¢‘çŽ‡åœ¨1GHzæ—¶åˆ©ç”¨çŽ‡ä¸º50%å’ŒCPUé¢‘çŽ‡åœ¨2GHzæ—¶åˆ©ç”¨çŽ‡ä¸º50%æ˜¯ä¸ä¸€æ ·çš„ï¼ŒåŒæ ·
åœ¨å°æ ¸ä¸Šè¿è¡Œæ—¶åˆ©ç”¨çŽ‡ä¸º50%å’Œåœ¨å¤§æ ¸ä¸Šè¿è¡Œæ—¶åˆ©ç”¨çŽ‡ä¸º50%æ˜¯ä¸ä¸€æ ·çš„ï¼Œæˆ‘ä»¬å…è®¸æž¶æž„
ä»¥ä¸¤ä¸ªæ¯”çŽ‡æ¥ä¼¸ç¼©æ—¶é—´å·®ï¼Œå…¶ä¸ä¸€ä¸ªæ˜¯åŠ¨æ€ç”µåŽ‹é¢‘çŽ‡å‡é™ï¼ˆDynamic Voltage and
Frequency Scalingï¼ŒDVFSï¼‰æ¯”çŽ‡ï¼Œå¦ä¸€ä¸ªæ˜¯å¾®æž¶æž„æ¯”çŽ‡ã€‚

å¯¹äºŽç®€å•çš„DVFSæž¶æž„ï¼ˆè½¯ä»¶æœ‰å®Œå…¨æŽ§åˆ¶èƒ½åŠ›ï¼‰ï¼Œæˆ‘ä»¬å¯ä»¥å¾ˆå®¹æ˜“åœ°è®¡ç®—è¯¥æ¯”çŽ‡ä¸º::

            f_cur
  r_dvfs := -----
            f_max

å¯¹äºŽç”±ç¡¬ä»¶æŽ§åˆ¶DVFSçš„æ›´å¤šåŠ¨æ€ç³»ç»Ÿï¼Œæˆ‘ä»¬ä½¿ç”¨ç¡¬ä»¶è®¡æ•°å™¨ï¼ˆIntel APERF/MPERFï¼Œ
ARMv8.4-AMUï¼‰æ¥è®¡ç®—è¿™ä¸€æ¯”çŽ‡ã€‚å…·ä½“åˆ°Intelï¼Œæˆ‘ä»¬ä½¿ç”¨::

           APERF
  f_cur := ----- * P0
           MPERF

             4C-turbo;  å¦‚æžœå¯ç”¨å¹¶ä¸”ä½¿èƒ½äº†turbo
  f_max := { 1C-turbo;  å¦‚æžœä½¿èƒ½äº†turbo
             P0;        å…¶å®ƒæƒ…å†µ

                    f_cur
  r_dvfs := min( 1, ----- )
                    f_max

æˆ‘ä»¬é€‰æ‹©4C turboè€Œä¸æ˜¯1C turboï¼Œä»¥ä½¿å…¶æ›´æŒä¹…æ€§ç•¥å¾®æ›´å¼ºã€‚

r_cpuè¢«å®šä¹‰ä¸ºå½“å‰CPUçš„æœ€é«˜æ€§èƒ½æ°´å¹³ä¸Žç³»ç»Ÿä¸ä»»ä½•å…¶å®ƒCPUçš„æœ€é«˜æ€§èƒ½æ°´å¹³çš„æ¯”çŽ‡ã€‚

  r_tot = r_dvfs * r_cpu

å…¶ç»“æžœæ˜¯ï¼Œä¸Šè¿°â€œè¿è¡Œâ€å’Œâ€œå¯è¿è¡Œâ€çš„æŒ‡æ ‡å˜æˆDVFSæ— å…³å’ŒCPUåž‹å·æ— å…³äº†ã€‚ä¹Ÿå°±æ˜¯è¯´ï¼Œ
æˆ‘ä»¬å¯ä»¥åœ¨CPUä¹‹é—´è½¬ç§»å’Œæ¯”è¾ƒå®ƒä»¬ã€‚

æ›´å¤šç»†èŠ‚è§:

 - kernel/sched/pelt.h:update_rq_clock_pelt()
 - arch/x86/kernel/smpboot.c:"APERF/MPERF frequency ratio computation."
 - Documentation/translations/zh_CN/scheduler/sched-capacity.rst:"1. CPU Capacity + 2. Task utilization"


UTIL_EST
========

ç”±äºŽå‘¨æœŸæ€§ä»»åŠ¡çš„å¹³å‡æ•°åœ¨ç¡çœ æ—¶ä¼šè¡°å‡ï¼Œè€Œåœ¨è¿è¡Œæ—¶å…¶é¢„æœŸåˆ©ç”¨çŽ‡ä¼šå’Œç¡çœ å‰ç›¸åŒï¼Œ
å› æ¤å®ƒä»¬åœ¨å†æ¬¡è¿è¡ŒåŽä¼šé¢ä¸´ï¼ˆDVFSï¼‰çš„ä¸Šæ¶¨ã€‚

ä¸ºäº†ç¼“è§£è¿™ä¸ªé—®é¢˜ï¼Œï¼ˆä¸€ä¸ªé»˜è®¤ä½¿èƒ½çš„ç¼–è¯‘é€‰é¡¹ï¼‰UTIL_ESTé©±åŠ¨ä¸€ä¸ªæ— é™è„‰å†²å“åº”
ï¼ˆInfinite Impulse Responseï¼ŒIIRï¼‰çš„EWMAï¼Œâ€œè¿è¡Œâ€å€¼åœ¨å‡ºé˜Ÿæ—¶æ˜¯æœ€é«˜çš„ã€‚
UTIL_ESTæ»¤æ³¢ä½¿å…¶åœ¨é‡åˆ°æ›´é«˜å€¼æ—¶ç«‹åˆ»å¢žåŠ ï¼Œè€Œé‡åˆ°ä½Žå€¼æ—¶ä¼šç¼“æ…¢è¡°å‡ã€‚

è¿›ä¸€æ¥ï¼Œè¿è¡Œé˜Ÿåˆ—çš„ï¼ˆå¯è¿è¡Œä»»åŠ¡çš„ï¼‰åˆ©ç”¨çŽ‡ä¹‹å’Œç”±ä¸‹å¼è®¡ç®—ï¼š

  util_est := \Sum_t max( t_running, t_util_est_ewma )

æ›´å¤šç»†èŠ‚è§: kernel/sched/fair.c:util_est_dequeue()


UCLAMP
======

å¯ä»¥åœ¨æ¯ä¸ªCFSæˆ–RTä»»åŠ¡ä¸Šè®¾ç½®æœ‰æ•ˆçš„u_minå’Œu_max clampå€¼ï¼ˆè¯‘æ³¨ï¼šclampå¯ä»¥ç†è§£
ä¸ºç±»ä¼¼æ»¤æ³¢å™¨çš„èƒ½åŠ›ï¼Œå®ƒå®šä¹‰äº†æœ‰æ•ˆå–å€¼èŒƒå›´çš„æœ€å¤§å€¼å’Œæœ€å°å€¼ï¼‰ï¼›è¿è¡Œé˜Ÿåˆ—ä¸ºæ‰€æœ‰æ£åœ¨
è¿è¡Œçš„ä»»åŠ¡ä¿æŒè¿™äº›clampçš„æœ€å¤§èšåˆå€¼ã€‚

æ›´å¤šç»†èŠ‚è§: include/uapi/linux/sched/types.h


Schedutil / DVFS
================

æ¯å½“è°ƒåº¦å™¨çš„è´Ÿè½½è·Ÿè¸ªè¢«æ›´æ–°æ—¶ï¼ˆä»»åŠ¡å”¤é†’ã€ä»»åŠ¡è¿ç§»ã€æ—¶é—´æµé€ï¼‰ï¼Œæˆ‘ä»¬éƒ½ä¼šè°ƒç”¨
schedutilæ¥æ›´æ–°ç¡¬ä»¶DVFSçŠ¶æ€ã€‚

å…¶åŸºç¡€æ˜¯CPUè¿è¡Œé˜Ÿåˆ—çš„â€œè¿è¡Œâ€æŒ‡æ ‡ï¼Œæ ¹æ®ä¸Šé¢çš„å†…å®¹ï¼Œå®ƒæ˜¯CPUçš„é¢‘çŽ‡ä¸å˜çš„åˆ©ç”¨çŽ‡
ä¼°è®¡å€¼ã€‚ç”±æ¤æˆ‘ä»¬è®¡ç®—å‡ºä¸€ä¸ªæœŸæœ›çš„é¢‘çŽ‡ï¼Œå¦‚ä¸‹::

             max( running, util_est );  å¦‚æžœä½¿èƒ½UTIL_EST
  u_cfs := { running;                   å…¶å®ƒæƒ…å†µ

               clamp( u_cfs + u_rt, u_min, u_max );  å¦‚æžœä½¿èƒ½UCLAMP_TASK
  u_clamp := { u_cfs + u_rt;                         å…¶å®ƒæƒ…å†µ

  u := u_clamp + u_irq + u_dl;		[ä¼°è®¡å€¼ã€‚æ›´å¤šç»†èŠ‚è§æºä»£ç ]

  f_des := min( f_max, 1.25 u * f_max )

å…³äºŽIO-waitçš„è¯´æ˜Žï¼šå½“å‘ç”Ÿæ›´æ–°æ˜¯å› ä¸ºä»»åŠ¡ä»ŽIOå®Œæˆä¸å”¤é†’æ—¶ï¼Œæˆ‘ä»¬æå‡ä¸Šé¢çš„â€œuâ€ã€‚

ç„¶åŽï¼Œè¿™ä¸ªé¢‘çŽ‡è¢«ç”¨æ¥é€‰æ‹©ä¸€ä¸ªP-stateæˆ–OPPï¼Œæˆ–è€…ç›´æŽ¥æ··å…¥ä¸€ä¸ªå‘ç»™ç¡¬ä»¶çš„CPPCå¼
è¯·æ±‚ã€‚

å…³äºŽæˆªæ¢æœŸé™è°ƒåº¦å™¨çš„è¯´æ˜Ž: æˆªæ¢æœŸé™ä»»åŠ¡ï¼ˆå¶å‘ä»»åŠ¡æ¨¡åž‹ï¼‰ä½¿æˆ‘ä»¬èƒ½å¤Ÿè®¡ç®—å‡ºæ»¡è¶³
å·¥ä½œè´Ÿè·æ‰€éœ€çš„ç¡¬f_minå€¼ã€‚

å› ä¸ºè¿™äº›å›žè°ƒå‡½æ•°æ˜¯ç›´æŽ¥æ¥è‡ªè°ƒåº¦å™¨çš„ï¼Œæ‰€ä»¥DVFSçš„ç¡¬ä»¶äº¤äº’åº”è¯¥æ˜¯â€œå¿«é€Ÿâ€å’Œéžé˜»å¡žçš„ã€‚
åœ¨ç¡¬ä»¶äº¤äº’ç¼“æ…¢å’Œæ˜‚è´µçš„æ—¶å€™ï¼Œschedutilæ”¯æŒDVFSè¯·æ±‚é™é€Ÿï¼Œä¸è¿‡ä¼šé™ä½Žæ•ˆçŽ‡ã€‚

æ›´å¤šä¿¡æ¯è§: kernel/sched/cpufreq_schedutil.c


æ³¨æ„
====

 - åœ¨ä½Žè´Ÿè½½åœºæ™¯ä¸‹ï¼ŒDVFSæ˜¯æœ€ç›¸å…³çš„ï¼Œâ€œè¿è¡Œâ€çš„å€¼å°†å¯†åˆ‡åæ˜ åˆ©ç”¨çŽ‡ã€‚

 - åœ¨è´Ÿè½½é¥±å’Œçš„åœºæ™¯ä¸‹ï¼Œä»»åŠ¡è¿ç§»ä¼šå¯¼è‡´ä¸€äº›çž¬æ—¶æ€§çš„ä½¿ç”¨çŽ‡ä¸‹é™ã€‚å‡è®¾æˆ‘ä»¬æœ‰ä¸€ä¸ª
   CPUï¼Œæœ‰4ä¸ªä»»åŠ¡å ç”¨å¯¼è‡´å…¶é¥±å’Œï¼ŒæŽ¥ä¸‹æ¥æˆ‘ä»¬å°†ä¸€ä¸ªä»»åŠ¡è¿ç§»åˆ°å¦ä¸€ä¸ªç©ºé—²CPUä¸Šï¼Œ
   æ—§çš„CPUçš„â€œè¿è¡Œâ€å€¼å°†ä¸º0.75ï¼Œè€Œæ–°çš„CPUå°†èŽ·å¾—0.25ã€‚è¿™æ˜¯ä¸å¯é¿å…çš„ï¼Œè€Œä¸”éšç€
   æ—¶é—´æµé€å°†è‡ªåŠ¨ä¿®æ£ã€‚å¦æ³¨ï¼Œç”±äºŽæ²¡æœ‰ç©ºé—²æ—¶é—´ï¼Œæˆ‘ä»¬è¿˜èƒ½ä¿è¯f_maxå€¼å—ï¼Ÿ

 - ä¸Šè¿°å¤§éƒ¨åˆ†å†…å®¹æ˜¯å…³äºŽé¿å…DVFSä¸‹æ»‘ï¼Œä»¥åŠç‹¬ç«‹çš„DVFSåŸŸå‘ç”Ÿè´Ÿè½½è¿ç§»æ—¶ä¸å¾—ä¸
   é‡æ–°å¦ä¹ /æå‡é¢‘çŽ‡ã€‚