so(shared object,共享库)是机器可以直接运行的二进制代码,是Android上的动态链接库,类似于Windows上的dll。每一个Android应用所支持的ABI是由其APK提供的.so文件决定的,这些so文件被打包在apk文件的lib/目录下。
so文件的本质就是ELF,所以来了解并分析一下ELF文件。
ELF(Executable and Linking Format)是一种对象文件的格式,用于定义不同类型的对象文件(Object files)中都放了什么东西、以及都以什么样的格式去放这些东西。组成部分有:文件头Header,段表Section,程序头Segment(权限相同又连在一起的段)
对象文件主要分为三类。
另外核心转储文件(Core Dump File)也属于对象文件,当进程意外终止,系统可以将该进程地址空间的内容及终止时的一些信息转存到核心转储文件。因为目前涉及的不多,不过多了解。
随便拿了一个so文件具体看一下结构,用到命令readelf,Windows下使用需要下载Cygwin,这里我直接在Linux里使用。
可以看到很丰富的Header信息
我们再结合一下Header的结构来看。路径是/usr/include/elf.h e_ident已经分析过了,前几个也都很好理解,主要介绍几个重要的字段。
这个so里包含了27个section,开始的偏移量是0x5a268也就是前面start of section headers的369256。
section head table(SHT)中,针对每一个section,都设置有一个条目用来描述对应的这个section,其内容主要包括该 section 的名称、类型、大小以及在整个ELF文件中的字节偏移位置等等。还是在elf.h里找到数据结构。都是和上面对应的,这里不做具体分析,以后再具体分析几个重要的节表,并且有基于对section的加密实现对so文件的加固操作。
查看共有8个程序头,且给出了section和segment的映射关系。同时在elf.h里找到对应的数据结构,注释的很清晰。其中只有LOAD类型的需要被映射加载。
可执行文件或者共享目标文件的程序头部是一个结构数组,每个结构描述了一个段或者系统准备程序执行所必须的其他信息。目标文件的“段”包含一个或者多个“节区”,也就是“段内容(Segment Contents)”。程序头部仅对可执行文件和共享目标文件有意义。
整个elf文件的组成可以用下图描述
ELF文件内容有两个平行视角:程序链接视图和程序运行(装载)视图。而关于节和段,学过操作系统里的分段/分页存储管理会容易理解一些。
简单理清一下ELF文件装载的过程。(大概流程,忽略链接等)
1、so动态库文件发挥作用都要经过两个过程
编译阶段。链接编辑器(link editor)拿它和其他Relocatable object file以及其他shared object file作为输入,经链接处理后,生成另外的 shared object file 或者 executable file。
运行阶段。动态链接器(dynamic linker)拿它和一个executable file以及另外一些 shared object file 来一起处理,在Linux系统里面创建一个进程映像。
2、Android中so的加载有两种方法
System.loadLibrary("hello");
系统会自动补全名字并去寻找它然后加载。两种方法最终都会调用nativeLoad(name, loader, ldLibraryPath)方法,只是因为loadLibrary的参数是so的文件名,所以需要首先找到这个文件的路径,然后加载这个so文件。 而load传入的参数是一个文件路径,所以它不需要去寻找这个文件路径,而是直接通过这个路径来加载so文件。
原来对于文件结构这些东西比较头大,在学习PE文件结构时也并没有认真总结,只是泛泛地过了一遍,所以导致有些地方一直模糊混淆。这次参考了很多文章和资料,较为完整地把elf格式分析了一遍,发现这些东西很重要也很有用,了解了它的本质东西,再去处理关于它的加密修复之类的问题就会思路更清晰,也有更多切入点。另外很深的体会就是,学好操作系统是非常重要的,文件结构等静态分析我们可以做到,但是涉及到动态加载运行的问题时,就必须了解操作系统里的原理。这部分还要不断总结学习。
这篇笔记里记录了so文件分析的大概流程,有一些更具体的部分,比如部分重要节表的分析并未涉及,会在后续关于“基于so中的section加密实现so加固”的笔记里再来记录。
虽然参考了很多文章资料,但是由于自己的认知理解仍不够深刻,难免还会有错误或者不当之处,望斧正。
《Android应用安全防护和逆向分析》
https://blog.csdn.net/michael1112/article/details/54579911
https://blog.csdn.net/muaxi8/article/details/79627859