您的位置:首页 > 移动开发 > Android开发

android系统休眠时冻结任务的分析

2017-09-26 15:07 561 查看
       安卓系统休眠的时候冻结了任务,导致驱动无法运行,触摸屏点击也没有反应,只能通过点击电源按键才能唤醒安卓系统。

       错误信息如下:

May 14 15:53:15 nb kernel: [30404.485085] PM: Syncing filesystems ... done.
May 14 15:53:15 nb kernel: [30404.711342] PM: Preparing system for mem sleep
May 14 15:53:15 nb kernel: [30404.711610] Freezing user space
processes ... (elapsed 0.001 seconds) done.
May 14 15:53:15 nb kernel: [30404.713305] Freezing remaining freezable
tasks ... (elapsed 0.001 seconds) done.


该调试信息其实源自/kernel/power/suspend.c文件,关键的部分代码如下:

/**
* enter_state - Do common work needed to enter system sleep state.
* @state: System sleep state to enter.
*
* Make sure that no one else is trying to put the system into a sleep state.
* Fail if that's not the case.  Otherwise, prepare for system suspend, make the
* system enter the given sleep state and clean up after wakeup.
*/
static int enter_state(suspend_state_t state)
{
int error;

trace_suspend_resume(TPS("suspend_enter"), state, true);
if (state == PM_SUSPEND_FREEZE) {
#ifdef CONFIG_PM_DEBUG
if (pm_test_level != TEST_NONE && pm_test_level <= TEST_CPUS) {
pr_warn("PM: Unsupported test mode for suspend to idle, please choose none/freezer/devices/platform.\n");
return -EAGAIN;
}
#endif
} else if (!valid_state(state)) {
return -EINVAL;
}
if (!mutex_trylock(&pm_mutex))
return -EBUSY;

if (state == PM_SUSPEND_FREEZE)
freeze_begin();

#ifndef CONFIG_SUSPEND_SKIP_SYNC
trace_suspend_resume(TPS("sync_filesystems"), 0, true);
pr_info("PM: Syncing filesystems ... ");
sys_sync();
pr_cont("done.\n");
trace_suspend_resume(TPS("sync_filesystems"), 0, false);
#endif

pr_debug("PM: Preparing system for sleep (%s)\n", pm_states[state]);
pm_suspend_clear_flags();
error = suspend_prepare(state);
if (error)
goto Unlock;

if (suspend_test(TEST_FREEZER))
goto Finish;

trace_suspend_resume(TPS("suspend_enter"), state, false);
pr_debug("PM: Suspending system (%s)\n", pm_states[state]);
pm_restrict_gfp_mask();
error = suspend_devices_and_enter(state);
pm_restore_gfp_mask();

Finish:
pr_debug("PM: Finishing wakeup.\n");
suspend_finish();
Unlock:
mutex_unlock(&pm_mutex);
return error;
}

/**
* pm_suspend - Externally visible function for suspending the system.
* @state: System sleep state to enter.
*
* Check if the value of @state represents one of the supported states,
* execute enter_state() and update system suspend statistics.
*/
int pm_suspend(suspend_state_t state)
{
int error;

if (state <= PM_SUSPEND_ON || state >= PM_SUSPEND_MAX)
return -EINVAL;

error = enter_state(state);
if (error) {
suspend_stats.fail++;
dpm_save_failed_errno(error);
} else {
suspend_stats.success++;
}
return error;
}
EXPORT_SYMBOL(pm_suspend);

以下是网友分析:

Android睡眠唤醒机制--Kernel态

转载 2012年11月01日 14:47:06

一、简介

      Android系统中定义了几种低功耗状态:earlysuspend、suspend、hibernation.

      1) earlysuspend: 是一种低功耗的状态,某些设备可以选择进入某种功耗较低的状态,比如 LCD可以降低亮度或灭掉; 

      2) suspend: 是指除电源管理以外的其他外围模块以及cpu均不工作,只有内存保持自刷新的状态;  

      3) hibernation是指所有内存镜像都被写入磁盘中,然后系统关机,恢复后系统将能恢复到“关机”之前的状态。是最彻底的低功耗模式,它把所有内存镜像都写入磁盘中,然后系统关机。该文件还在sysfs文件系统中创建了多个entry,分别是/sys/power/disk,/sys/power/resume和/sys/power/image_size,这样用户可以直接通过 sysfs 来控制系统进出hibernation状态。这块代码跟标准Linux内核没有什么区别。

     

       在打过android补丁的内核中, state_store()函数会走另外一条路,会进入到request_suspend_state()中, 这个文件在earlysuspend.c中. 这些功能都是android系统加的,后面会对earlysuspend和late resume 进行介绍。

二、用户接口

      电源管理内核层给应用层提供的接口就是sysfs 文件系统,所有的相关接口都通过sysfs实现。Android上层frameworks也是基于sysfs做了包装,最终提供给Android java应用程序的是java类的形式。

Android系统会在sysfs里面创建以entry:

     /sys/power/state

     /sys/power/wake_lock

     /sys/power/wake_unlock

     echo mem > /sys/power/state或echo standby > /sys/power/state: 命令系统进入earlysuspend状态,那些注册了early suspend handler的驱动将依次进入各自的earlysuspend 状态。

     echo on > /sys/power/state: 将退出early suspend状态

     echo disk > /sys/power/state: 命令系统进入hibernation状态

    echo lockname > /sys/power/wake_lock: 加锁“lockname”

    echo lockname > /sys/power/wake_unlock: 解锁“lockname”

    上述是分别加锁和解锁的命令,一旦系统中所有wakelock被解锁,系统就会进入suspend状态,可见Linux中原本使系统suspend 的操作(echo mem > /sys/power/state 等)在Android被替换成使系统进入early suspend;而wake lock 机制成为用户命令系统进入suspend状态的唯一途径。

 

三、Android 休眠(suspend)

1. 相关文件
     • kernel/kernel/power/main.c

     • kernel/kernel/power/earlysuspend.c

     • kernel/kernel/power/wakelock.c

 

2. 特性介绍

    1) Early Suspend
       Early suspend 是android 引进的一种机制,这种机制在上游备受争议,这里不做评论。 这个机制作用是在关闭显示的时候,一些和显示有关的设备,比如LCD背光、重力感应器、 触摸屏都会关掉,但是系统可能还是在运行状态(这时候还有wake lock)进行任务的处理,例如在扫描 SD卡上的文件等。 在嵌入式设备中,背光是一个很大的电源消耗,所以android会加入这样一种机制。

     2) Late Resume
         Late Resume 是和suspend 配套的一种机制,是在内核唤醒完毕开始执行的。主要就是唤醒在Early Suspend时休眠的设备。

     3) Wake Lock
         wake_lock 在Android的电源管理系统中扮演一个核心的角色。wake_lock是一种锁的机制,只要有人拿着这个锁,系统就无法进入休眠,可以被用户态程序和内核获得。这个锁可以是有超时的或者是没有超时的,超时的锁会在超时以后自动解锁。如果没有锁了或者超时了,内核就会启动休眠的那套机制来进入休眠。

3. Android Suspend
      main.c文件是整个框架的入口。用户可以通过读写sys文件/sys/power/state实现控制系统进入低功耗状态。用户对于/sys/power/state的读写会调用到main.c中的state_store(),用户可以写入const char * const pm_states[] 中定义的字符串, 比如“on”,“mem”,“standby”,“disk”。 

      state_store()首先判断用户写入的是否是“disk”字符串,如果是则调用hibernate()函数命令系统进入hibernation状态。如果是其他字符串则调用request_suspend_state()(如果定义 CONFIG_EARLYSUSPEND)或者调用enter_state()(如果未定义CONFIG_EARLYSUSPEND)。  request_suspend_state()函数是android相对标准linux改动的地方,它实现在earlysuspend.c中。在标准linux内核中,用户通过
sysfs 写入“mem”和“standby”时,会直接调用enter_state()进入suspend模式,但在android中则会调用request_suspend_state()函数进入early suspend状态。request_suspend_state()函数代码如下:    

 

[cpp]
view plain
copy

void request_suspend_state(suspend_state_t new_state)  
{  
    unsigned long irqflags;  
    int old_sleep;  
  
#ifdef CONFIG_PLAT_RK  
    if (system_state != SYSTEM_RUNNING)  
        return;  
#endif  
  
    spin_lock_irqsave(&state_lock, irqflags);  
    old_sleep = state & SUSPEND_REQUESTED;  
    if (debug_mask & DEBUG_USER_STATE) {  
        struct timespec ts;  
        struct rtc_time tm;  
        getnstimeofday(&ts);  
        rtc_time_to_tm(ts.tv_sec, &tm);  
        pr_info("request_suspend_state: %s (%d->%d) at %lld "  
            "(%d-%02d-%02d %02d:%02d:%02d.%09lu UTC)\n",  
            new_state != PM_SUSPEND_ON ? "sleep" : "wakeup",  
            requested_suspend_state, new_state,  
            ktime_to_ns(ktime_get()),  
            tm.tm_year + 1900, tm.tm_mon + 1, tm.tm_mday,  
            tm.tm_hour, tm.tm_min, tm.tm_sec, ts.tv_nsec);  
    }  
    if (!old_sleep && new_state != PM_SUSPEND_ON) {  
        state |= SUSPEND_REQUESTED;  
                  //进入Early suspend处理,执行函数early_suspend  
        queue_work(suspend_work_queue, &early_suspend_work);  
    } else if (old_sleep && new_state == PM_SUSPEND_ON) {  
        state &= ~SUSPEND_REQUESTED;  
        wake_lock(&main_wake_lock);  
                  //进入Late resume处理,执行函数late_resume  
        queue_work(suspend_work_queue, &late_resume_work);  
    }  
    requested_suspend_state = new_state;  
    spin_unlock_irqrestore(&state_lock, irqflags);  
}  

4. Early Suspend
       在early_suspend()函数中,首先会检查现在请求的状态还是否是suspend, 来防止suspend的请求会在这个时候取消掉(因为这个时候用户进程还在运行),如果需要退出,就简单的退出了。如果没有, 这个函数就会把early_suspend_handlers中注册的一系列的回调(通过register_early_suspend注册)都调用一次,然后同步文件系统, 然后放弃掉main_wake_lock,
这个wake lock是一个没有超时的锁,如果这个锁不释放,那么系统就无法进入休眠。

   注:fbearlysuspend.c和consoleearlysuspend.c这两个文件实现了针对lcd framebuffer的earlysuspend支持和console的earlysuspend支持。实际上这两个文件就是利用上面earlysuspend.c提供的接口注册了针对framebuffer和console的early suspend handler,并提供相应的handler函数。

[cpp]
view plain
copy

static void early_suspend(struct work_struct *work)  
{  
    struct early_suspend *pos;  
    unsigned long irqflags;  
    int abort = 0;  
  
#ifdef CONFIG_PLAT_RK  
    if (system_state != SYSTEM_RUNNING)  
        return;  
#endif  
  
    mutex_lock(&early_suspend_lock);  
    spin_lock_irqsave(&state_lock, irqflags);  
    if (state == SUSPEND_REQUESTED)  
        state |= SUSPENDED;  
    else  
        abort = 1;  
    spin_unlock_irqrestore(&state_lock, irqflags);  
  
    if (abort) {  
        if (debug_mask & DEBUG_SUSPEND)  
            pr_info("early_suspend: abort, state %d\n", state);  
        mutex_unlock(&early_suspend_lock);  
        goto abort;  
    }  
  
    if (debug_mask & DEBUG_SUSPEND)  
        pr_info("early_suspend: call handlers\n");  
    list_for_each_entry(pos, &early_suspend_handlers, link) {  
        if (pos->suspend != NULL) {  
            if (debug_mask & DEBUG_VERBOSE)  
                pr_info("early_suspend: calling %pf\n", pos->suspend);  
            pos->suspend(pos);  
        }  
    }  
    mutex_unlock(&early_suspend_lock);  
  
#ifdef CONFIG_SUSPEND_SYNC_WORKQUEUE  
    suspend_sys_sync_queue();  
#else  
    if (debug_mask & DEBUG_SUSPEND)  
        pr_info("early_suspend: sync\n");  
  
    sys_sync();  
#endif  
abort:  
    spin_lock_irqsave(&state_lock, irqflags);  
    if (state == SUSPEND_REQUESTED_AND_SUSPENDED)  
        wake_unlock(&main_wake_lock);  
    spin_unlock_irqrestore(&state_lock, irqflags);  
}  

5. Late Resume

      当所有的唤醒已经结束以后,用户进程都已经开始运行了,唤醒通常会是以下的几种原因:

     • 来电

       如果是来电,那么Modem会通过发送命令给rild来让rild通知WindowManager有来电响应,这样就会远程调用PowerManagerService来写"on" 到 /sys/power/state 来执行late resume的设备,比如点亮屏幕等。

    • 用户按键

      用户按键事件会送到WindowManager中,WindowManager会处理这些按键事件,按键分为几种情况,如果按键不是唤醒键(能够唤醒系统的按键) 那么WindowManager会主动放弃wakeLock来使系统再次进入休眠,如果按键是唤醒键,那么WindowManger就会调用PowerManagerService中的接口来执行Late
Resume。

   Late Resume 会依次唤醒前面调用了Early Suspend的设备。

[cpp]
view plain
copy

static void late_resume(struct work_struct *work)  
{  
    struct early_suspend *pos;  
    unsigned long irqflags;  
    int abort = 0;  
  
#ifdef CONFIG_PLAT_RK  
    if (system_state != SYSTEM_RUNNING)  
        return;  
#endif  
  
    mutex_lock(&early_suspend_lock);  
    spin_lock_irqsave(&state_lock, irqflags);  
    if (state == SUSPENDED)  
        state &= ~SUSPENDED;  
    else  
        abort = 1;  
    spin_unlock_irqrestore(&state_lock, irqflags);  
  
    if (abort) {  
        if (debug_mask & DEBUG_SUSPEND)  
            pr_info("late_resume: abort, state %d\n", state);  
        goto abort;  
    }  
    if (debug_mask & DEBUG_SUSPEND)  
        pr_info("late_resume: call handlers\n");  
    list_for_each_entry_reverse(pos, &early_suspend_handlers, link) {  
        if (pos->resume != NULL) {  
            if (debug_mask & DEBUG_VERBOSE)  
                pr_info("late_resume: calling %pf\n", pos->resume);  
  
            pos->resume(pos);  
        }  
    }  
    if (debug_mask & DEBUG_SUSPEND)  
        pr_info("late_resume: done\n");  
abort:  
    mutex_unlock(&early_suspend_lock);  
}  

6. Wake Lock
    wake_lock防止正在运行的系统进入suspend或其它低功耗状态。

     Android改动较大的另一处是增加了wakelock机制。实现在wakelock.c和userwakelock.c中。wakelock可以阻止处于正常运行(active)或者空闲(idle)状态的系统进入睡眠等低功耗状态。直到所持有的wakelock全部被释放,系统才能进入睡眠等低功耗的状态。

    我们接下来看一看wake lock的机制是怎么运行和起作用的,主要关注 wakelock.c(wake_lock)文件就可以了。

    1) wake lock 有加锁和解锁两种状态,加锁的方式有两种:

    • 第一种是永久的锁住,这样的锁除非显示的放开,是不会解锁的,所以这种锁的使用是非常小心的。

    • 第二种是超时锁,这种锁会锁定系统唤醒一段时间,如果这个时间过去了,这个锁会自动解除。

    2) 锁有两种类型:

    • WAKE_LOCK_SUSPEND:这种锁会防止系统进入睡眠(suspend)。

    • WAKE_LOCK_IDLE:这种锁不会影响系统的休眠,用于阻止系统在持有锁的过程中进入低功耗状态。即直到wake_lock被释放,系统才会从idle状态进入低功耗状态,此低功耗状态将使中断延迟或禁用一组中断。

    3) 在wake lock中, 会有3个地方让系统直接开始suspend(), 分别是:

    • 在wake_unlock()中, 如果发现解锁以后没有任何其他的wake lock了,就开始休眠

    • 在定时器都到时间以后,定时器的回调函数会查看是否有其他的wake lock,如果没有,就在这里让系统进入睡眠。

    • 在wake_lock() 中,对一个wake lock加锁以后,会再次检查一下有没有锁, 我想这里的检查是没有必要的, 更好的方法是使加锁的这个操作原子化,而不是繁冗的检查,而且这样的检查也有可能漏掉。 

7. Suspend

    当wake_lock 运行 suspend()以后, 在wakelock.c的suspend()函数会被调用,这个函数首先sync文件系统,然后调用pm_suspend(request_suspend_state),接下来pm_suspend()就会调用enter_state()来进入Linux的休眠流程...

[cpp]
view plain
copy

static void suspend(struct work_struct *work)  
{  
    int ret;  
    int entry_event_num;  
    struct timespec ts_entry, ts_exit;  
  
    if (has_wake_lock(WAKE_LOCK_SUSPEND)) {  
        if (debug_mask & DEBUG_SUSPEND)  
            pr_info("suspend: abort suspend\n");  
        return;  
    }  
  
    entry_event_num = current_event_num;  
#ifdef CONFIG_SUSPEND_SYNC_WORKQUEUE  
    suspend_sys_sync_queue();  
#else  
    sys_sync();  
#endif  
    if (debug_mask & DEBUG_SUSPEND)  
        pr_info("suspend: enter suspend\n");  
    getnstimeofday(&ts_entry);  
    ret = pm_suspend(requested_suspend_state);  
    getnstimeofday(&ts_exit);  
  
    if (debug_mask & DEBUG_EXIT_SUSPEND) {  
        struct rtc_time tm;  
        rtc_time_to_tm(ts_exit.tv_sec, &tm);  
        pr_info("suspend: exit suspend, ret = %d "  
            "(%d-%02d-%02d %02d:%02d:%02d.%09lu UTC)\n", ret,  
            tm.tm_year + 1900, tm.tm_mon + 1, tm.tm_mday,  
            tm.tm_hour, tm.tm_min, tm.tm_sec, ts_exit.tv_nsec);  
    }  
  
    if (ts_exit.tv_sec - ts_entry.tv_sec <= 1) {  
        ++suspend_short_count;  
  
        if (suspend_short_count == SUSPEND_BACKOFF_THRESHOLD) {  
            suspend_backoff();  
            suspend_short_count = 0;  
        }  
    } else {  
        suspend_short_count = 0;  
    }  
  
    if (current_event_num == entry_event_num) {  
        if (debug_mask & DEBUG_SUSPEND)  
            pr_info("suspend: pm_suspend returned with no event\n");  
        wake_lock_timeout(&unknown_wakeup, HZ / 2);  
    }  
}  

8. Android于标准Linux休眠的区别

      pm_suspend() 虽然用enter_state()来进入标准的Linux休眠流程,但是还是有一些区别:

      当进入冻结进程的时候,android首先会检查有没有wake lock,如果没有,才会停止这些进程,因为在开始suspend和冻结进程期间有可能有人申请了wake lock,如果是这样,冻结进程会被中断。

      在suspend_late()中,会最后检查一次有没有wake lock,这有可能是某种快速申请wake lock,并且快速释放这个锁的进程导致的,如果有这种情况, 这里会返回错误, 整个suspend就会全部放弃。如果pm_suspend()成功了,LOG的输出可以通过在kernel cmd里面增加 "no_console_suspend" 来看到suspend和resume过程中的log输出。

参考资料:http://bbs.csdn.net/topics/360263959?page=1
http://blog.csdn.net/zhenwenxian/article/details/5968292
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息