如何获取应用程序的绝对路径

来源: 作者:kdenewer
  经常看到有人提问在linux中如何获取当前应用程序的绝对路径, 却很少有人能比较好的解答. 现转贴www.linuxforum.net上的一篇文章, 希望能对受这个问题困扰的人有帮助.



13.12 如何获取当前进程对应之静态映像文件的绝对路径

A: hushui110@水木清华

这是一个x86/Linux Kernel 2.4.7-10系统中利用proc获取绝对路径的例子

--------------------------------------------------------------------------

/*

* gcc -Wall -pipe -g -static -o myprog_2 myprog_2.c

*/

#include

#include

#include



#define MAXBUFSIZE 1024



int main ( int argc, char * argv[] )

{

char buf[ MAXBUFSIZE ];

int count;



count = readlink( "/proc/self/exe", buf, MAXBUFSIZE );

if ( count < 0 || count >= MAXBUFSIZE )

{

printf( "Failed\n" );

return( EXIT_FAILURE );

}

buf[ count ] = '\0';

printf( "/proc/self/exe -> [%s]\n", buf );

return( EXIT_SUCCESS );

} /* end of main */


--------------------------------------------------------------------------

[scz@ /home/scz/src]> echo $PATH
/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:.
[scz@ /home/scz/src]> ./myprog_2
/proc/self/exe -> [/home/scz/src/myprog_2]
[scz@ /home/scz/src]> ../src/myprog_2
/proc/self/exe -> [/home/scz/src/myprog_2]
[scz@ /home/scz/src]> myprog_2
/proc/self/exe -> [/home/scz/src/myprog_2]
[scz@ /home/scz/src]>

显然这里直接给出了最期待的结果,没有冗余信息。

A: scz & microcat
2000-03-18

下面在x86/Linux Kernel 2.4.7-10上演示、讨论

--------------------------------------------------------------------------

*

* gcc -Wall -pipe -g -static -o myprog myprog.c

*/

#include

#include



int main ( int argc, char * argv[] )

{

return( EXIT_SUCCESS );

} /* end of main */


--------------------------------------------------------------------------

[scz@ /home/scz/src]> gcc -Wall -pipe -g -static -o myprog myprog.c
[scz@ /home/scz/src]> echo $PATH
/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:.
[scz@ /home/scz/src]> gdb ./myprog
(gdb) b main
(gdb) r
(gdb) x/17s 0xbfffff00
0xbfffff00: "SHLVL=1"
0xbfffff08: "_=/bin/bash"
0xbfffff14: "SHELL=/bin/bash"
0xbfffff24: "HOSTTYPE=i386"
0xbfffff32: "OSTYPE=linux-gnu"
0xbfffff43: "HISTSIZE=1000"
0xbfffff51: "TERM=vt100"
0xbfffff5c: "HOME=/home/scz"
0xbfffff6b: "SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass"
0xbfffff9e: "PATH=/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:."
0xbfffffd2: "LESSCHARSET=latin1"
0xbfffffe5: "/home/scz/src/./myprog" <-- 注意这个输出
0xbffffffc: ""
0xbffffffd: ""
0xbffffffe: ""
0xbfffffff: ""
0xc0000000:

[scz@ /home/scz/src]> gdb myprog
(gdb) b main
(gdb) r
(gdb) x/17s 0xbfffff00
0xbfffff00: "z"
0xbfffff02: "SHLVL=1"
0xbfffff0a: "_=/bin/bash"
0xbfffff16: "SHELL=/bin/bash"
0xbfffff26: "HOSTTYPE=i386"
0xbfffff34: "OSTYPE=linux-gnu"
0xbfffff45: "HISTSIZE=1000"
0xbfffff53: "TERM=vt100"
0xbfffff5e: "HOME=/home/scz"
0xbfffff6d: "SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass"
0xbfffffa0: "PATH=/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:."
0xbfffffd4: "LESSCHARSET=latin1"
0xbfffffe7: "/home/scz/src/myprog" <-- 注意这个输出
0xbffffffc: ""
0xbffffffd: ""
0xbffffffe: ""
0xbfffffff: ""
[scz@ /home/scz/src]> gdb ../src/myprog
(gdb) b main
(gdb) r
(gdb) x/17s 0xbfffff00
0xbfffff00: "=1"
0xbfffff03: "_=/bin/bash"
0xbfffff0f: "SHELL=/bin/bash"
0xbfffff1f: "HOSTTYPE=i386"
0xbfffff2d: "OSTYPE=linux-gnu"
0xbfffff3e: "HISTSIZE=1000"
0xbfffff4c: "TERM=vt100"
0xbfffff57: "HOME=/home/scz"
0xbfffff66: "SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass"
0xbfffff99: "PATH=/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:."
0xbfffffcd: "LESSCHARSET=latin1"
0xbfffffe0: "/home/scz/src/../src/myprog" <-- 注意这个输出
0xbffffffc: ""
0xbffffffd: ""
0xbffffffe: ""
0xbfffffff: ""
0xc0000000:

[scz@ /home/scz/src]>

这是ELF文件在Linux系统中加载进内存之后的布局简图

--------------------------------------------------------------------------
0x08048000 code .text,代码,只读
data .data,包含已经初始化的数据,只读
bss .bss,未初始化数据,初始化成0,读/写
... 堆区,动态分配获取的内存从.bss往内存高端增长
... (heap),读/写
...
stack 栈区,起始地址大于0xBFFF0000
arguments main()的形参
environment 环境变量区域
program name execve()第一形参,不是argv[0]
0xBFFFFFFC null(dword) 最后四个字节固定为零
0xC0000000
--------------------------------------------------------------------------

通常动态链接库被映射到0x40000000往高端的地址。对于Linux,如果打了不可执行
堆栈内核补丁,动态链接库被映射到0x40000000往低端的地址。tt说就是以前的映射
地址减去0x40000000。打了补丁后使得通过字符串拷贝(strcpy)传递shellcode相对
复杂化,需要更多技巧。

program name处不一定是绝对路径,实际对应了execve()第一形参。一般从shell上
启动进程,shell根据PATH环境变量自动搜索匹配出一个路径,未必是绝对路径。假
设PATH环境变量中有当前目录(.),所执行的程序也只在当前目录下有,直接指定程
序名(myprog)执行时,shell会向execve()第一形参传递"./myprog"。注意,execve
第一形参未必是绝对路径。用gdb加载后再执行,情况有所不同。如果gdb命令行上指
定的程序名非绝对路径,gdb在调用execve()之前会调用getcwd()拼接在程序名之前,

此时不依赖PATH环境变量。所以用gdb调试溢出程序时应该在命令行上指定绝对路径,

避免不必要的偏移调整。

现在来看这样一个演示程序

--------------------------------------------------------------------------

/*

* gcc -Wall -pipe -g -static -o myprog_1 myprog_1.c

*/

#include

#include



extern char **environ;



int main ( int argc, char * argv[] )

{

char *path = ( char * )( 0xc0000000 - 5 );



while ( *--path );

++path;

printf( "path --> %08x [%s]\n", ( unsigned int )path, path );

printf( "argv --> %08x\n", ( unsigned int )argv );

printf( "argv[0] --> %08x [%s]\n", ( unsigned int )argv[0],
argv[0] );

printf( "environ --> %08x\n", ( unsigned int )environ );

printf( "environ[0] --> %08x [%s]\n", ( unsigned int )environ[0],
environ[0] );

return( EXIT_SUCCESS );

} /* end of main */


--------------------------------------------------------------------------

直接执行,然后用gdb加载后执行,对比输出上的不同。

[scz@ /home/scz/src]> myprog_1
path --> bffffff1 [./myprog_1] <-- 注意这里前面多了一个"./"
argv --> bffffb24
argv[0] --> bffffc29 [myprog_1]
environ --> bffffb2c
environ[0] --> bffffc32 [PWD=/home/scz/src]
[scz@ /home/scz/src]> ./myprog_1
path --> bffffff1 [./myprog_1]
argv --> bffffb24
argv[0] --> bffffc27 [./myprog_1]
environ --> bffffb2c
environ[0] --> bffffc32 [PWD=/home/scz/src]
[scz@ /home/scz/src]> ../src/myprog_1
path --> bfffffec [../src/myprog_1]
argv --> bffffb14
argv[0] --> bffffc18 [../src/myprog_1]
environ --> bffffb1c
environ[0] --> bffffc28 [PWD=/home/scz/src]
[scz@ /home/scz/src]>

Linux系统中main()函数里自修改argv[0]欺骗ps有效,而FreeBSD、Solaris则无效。

execve()第二形参可以指定不同于第一形参的argv[0]。argv[0]不可信,但execve()
第一形参相对就可信得多。如果是自己写程序,可以考虑在main()中第一时刻判断
execve()第一形参是否为相对路径,进而决定是否调用getcwd(),最后拼接出一个绝
对路径。就像gdb所做的那样。

需要考虑"/home/scz/src/./myprog"、"/home/scz/src/../src/myprog"这些情况,
消掉"./"、"../"等冗余信息。

A: scz & microcat
2002-09-13 18:00

下面在SARPC/Solaris 8 64-bit kernel mode上演示、讨论

--------------------------------------------------------------------------

/*

* gcc -Wall -pipe -g -static -o myprog_3 myprog_3.c

*/

#include

#include



extern char **environ;



static void outputBinary ( const unsigned char *byteArray, const size_t
byteArrayLen )

{

size_t offset, k, j, i;



fprintf( stderr, "byteArray [ %u bytes ] ----> \n", byteArrayLen );

if ( byteArrayLen <= 0 )

{

return;

}

i = 0;

offset = 0;

for ( k = byteArrayLen / 16; k > 0; k--, offset += 16 )

{

fprintf( stderr, "%08X ", offset );

for ( j = 0; j < 16; j++, i++ )

{

if ( j == 8 )

{

fprintf( stderr, "-%02X", byteArray[ i ] );

}

else

{

fprintf( stderr, " %02X", byteArray[ i ] );

}

}

fprintf( stderr, " " );

i -= 16;

for ( j = 0; j < 16; j++, i++ )

{

/*

* if ( isprint( (int)byteArray[ i ] ) )

*/

if ( ( byteArray[ i ] >= ' ' ) && ( byteArray[ i ]
<= 255 )

&& ( byteArray[ i ] != 0x7f ) )

{

fprintf( stderr, "%c", byteArray[ i ] );

}

else

{

fprintf( stderr, "." );

}

}

fprintf( stderr, "\n" );

} /* end of for */

k = byteArrayLen - i;

if ( k <= 0 )

{

return;

}

fprintf( stderr, "%08X ", offset );

for ( j = 0 ; j < k; j++, i++ )

{

if ( j == 8 )

{

fprintf( stderr, "-%02X", byteArray[ i ] );

}

else

{

fprintf( stderr, " %02X", byteArray[ i ] );

}

}

i -= k;

for ( j = 16 - k; j > 0; j-- )

{

fprintf( stderr, " " );

}

fprintf( stderr, " " );

for ( j = 0; j < k; j++, i++ )

{

if ( ( byteArray[ i ] >= ' ' ) && ( byteArray[ i ] <=
255 )

&& ( byteArray[ i ] != 0x7f ) )

{

fprintf( stderr, "%c", byteArray[ i ] );

}

else

{

fprintf( stderr, "." );

}

}

fprintf( stderr, "\n" );

return;

} /* end of outputBinary */



int main ( int argc, char * argv[] )

{

char *path = ( char * )( 0xffbf0000 - 5 );



while ( *path == '\0' )

{

path--;

}

while ( *path )

{

path--;

}

++path;

printf( "path --> %08x [%s]\n", ( unsigned int )path, path );

printf( "argv --> %08x\n", ( unsigned int )argv );

printf( "argv[0] --> %08x [%s]\n", ( unsigned int )argv[0],
argv[0] );

printf( "environ --> %08x\n", ( unsigned int )environ );

printf( "environ[0] --> %08x [%s]\n", ( unsigned int )environ[0],
environ[0] );

outputBinary( ( const unsigned char * )( 0xffbf0000 - 256 ), 256 );

return( EXIT_SUCCESS );

} /* end of main */


--------------------------------------------------------------------------

直接执行,然后用gdb加载后执行,对比输出上的不同。SPARC/Solaris与x86/Linux
在此问题上有不少区别。

[scz@ /home/scz/src]> echo $PATH
/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:.
[scz@ /export/home/scz/src]> myprog_3
path --> ffbeffee [myprog_3]
argv --> ffbefcfc
argv[0] --> ffbefd7c [myprog_3]
environ --> ffbefd04
environ[0] --> ffbefd85 [PWD=/export/home/scz/src]
[scz@ /export/home/scz/src]> ./myprog_3
path --> ffbefff0 [myprog_3] <-- 注意这里前面反而没有了"./"
argv --> ffbefcfc
argv[0] --> ffbefd7c [./myprog_3]
environ --> ffbefd04
environ[0] --> ffbefd87 [PWD=/export/home/scz/src]
[scz@ /export/home/scz/src]> ../src/myprog_3
path --> ffbeffea [../src/myprog_3]
argv --> ffbefcec
argv[0] --> ffbefd6c [../src/myprog_3]
environ --> ffbefcf4
environ[0] --> ffbefd7c [PWD=/export/home/scz/src]
[scz@ /export/home/scz/src]>

如果我们复制myprog_3到/usr/bin下去,再次执行myprog_3,可以看到如下输出

[scz@ /export/home/scz/src]> myprog_3
path --> ffbeffe9 [/usr/bin/myprog_3] <-- 注意这里
argv --> ffbefcf4
argv[0] --> ffbefd74 [myprog_3]
environ --> ffbefcfc
environ[0] --> ffbefd7d [PWD=/export/home/scz/src]
byteArray [ 256 bytes ] ---->
00000000 55 6C 74 72 61 2D 35 5F-31 30 00 53 48 4C 56 4C Ultra-5_10.SHLVL
00000010 3D 31 00 5F 49 4E 49 54-5F 55 54 53 5F 4D 41 43 =1._INIT_UTS_MAC
00000020 48 49 4E 45 3D 73 75 6E-34 75 00 53 48 45 4C 4C HINE=sun4u.SHELL
00000030 3D 2F 62 69 6E 2F 62 61-73 68 00 48 4F 53 54 54 =/bin/bash.HOSTT
00000040 59 50 45 3D 73 70 61 72-63 00 4F 53 54 59 50 45 YPE=sparc.OSTYPE
00000050 3D 73 6F 6C 61 72 69 73-32 2E 38 00 48 4F 4D 45 =solaris2.8.HOME
00000060 3D 2F 65 78 70 6F 72 74-2F 68 6F 6D 65 2F 73 63 =/export/home/sc
00000070 7A 00 54 45 52 4D 3D 76-74 31 30 30 00 50 41 54 z.TERM=vt100.PAT
00000080 48 3D 2F 62 69 6E 3A 2F-75 73 72 2F 62 69 6E 3A H=/bin:/usr/bin:
00000090 2F 73 62 69 6E 3A 2F 75-73 72 2F 73 62 69 6E 3A /sbin:/usr/sbin:
000000A0 2F 75 73 72 2F 6C 6F 63-61 6C 2F 62 69 6E 3A 2E /usr/local/bin:.
000000B0 00 5F 49 4E 49 54 5F 4E-45 54 5F 53 54 52 41 54 ._INIT_NET_STRAT
000000C0 45 47 59 3D 6E 6F 6E 65-00 5F 3D 2F 62 69 6E 2F EGY=none._=/bin/
000000D0 6D 79 70 72 6F 67 5F 33-00 53 55 4E 57 2C 55 6C myprog_3.SUNW,Ul
000000E0 74 72 61 2D 35 5F 31 30-00 2F 75 73 72 2F 62 69 tra-5_10./usr/bi
000000F0 6E 2F 6D 79 70 72 6F 67-5F 33 00 00 00 00 00 00 n/myprog_3......
[scz@ /export/home/scz/src]>

前面说的getcwd()拼接技术同样适用于SPARC/Solaris 8。

与Linux相比,有几处重要变化,一是从0xC0000000变成0xFFBF0000,二是如果程序
在当前目录下,没有了前面的"./",三是SPARC芯片的一些对齐特性导致我们要找的
位置可能比想像的要向内存低端移动一些字节。

后两点容易理解,那我们是如何确定0xC0000000、0xFFBF0000的呢。这个问题实际上
就是<<如何编程获取栈底地址>>所解决的,参看这篇QA。假设堆栈(stac
k)向低地址
方向增长,则所谓栈底指堆栈(stack)最高地址,下面是tt用程序找出来的

x86/Linux 栈底是0xc0000000( 栈底往低地址的4个字节总是零 )
SPARC/Solaris 7/8 栈底是0xffbf0000( 栈底往低地址的4个字节总是零 )
SPARC/Solaris 2.6 栈底是0xf0000000( 栈底往低地址的4个字节总是零 )
x86/FreeBSD 栈底是0xbfc00000( 栈底往低地址的4个字节总是零 )
x86/NetBSD 1.5 栈底是0xbfbfe000
x86/OpenBSD 2.8 栈底是0xdfbfe000

利用ELF文件加载进内存之后的布局获取绝对路径固然可行,但是带有很强的Hacking
味,并不可取,不是万不得已不要使用这种技术。

Linux有"/proc/self/exe",Solaris有"/proc/self/auxv",这些都是可以一用的。
当然在Solaris系统中直接使用getexecname(3C)获取execve()第一形参最好,否则涉
及在用户空间读取U区的问题,也带有很强的Kernel
Hacking味道。参看<<如何在命
令行上访问指定进程P、U两区,如何欺骗Solaris的ps>>、<e(3C)是怎么
实现的>>两篇QA。

D: law@水木清华

在main()一开始就取execve()第一形参,或者退而求其次取argv[0],然后解析$PATH
环境变量,自己确定哪个目录里含有进程静态文件映像。如果是取execve()第一形参

时间:2003-03-02 13:48 来源: 作者:kdenewer 原文链接

好文,顶一下
(0)
0%
文章真差,踩一下
(0)
0%
------分隔线----------------------------


把开源带在你的身边-精美linux小纪念品
无觅相关文章插件,快速提升流量