OpenMP在ARM-Linux以及NDK中的编译和使用
2017-03-25 12:10
337 查看
OpenMP在ARM-Linux以及NDK中的编译和使用
参考:http://blog.sina.com.cn/s/blog_602f87700102w1ki.html以前对OpenCV在ARM-Linux,ARM-Android上的优化做了很多编译方面的努力,例如添加TBB支持,添加CUDA支持(NvidiaK1平台上)。这次突然听同事说增加了OpenMP选项后,在Windows+X86上有极大的优势,adaboost速度提高3倍。所以赶快在ARM-Android-NDK上测试一下。
0. OpenMP基础:
OpenMP(OpenMulti-Processing)是由OpenMPArchitecture Review Board牵头提出的,并已被广泛接受的,用于共享内存并行系统的多线程程序设计的一套指导性注释(CompilerDirective)。OpenMP支持的编程语言包括C语言、C++和Fortran;而支持OpenMP的编译器包括Sun
Studio和Intel Compiler,以及开放源码的GCC和Open64编译器。OpenMP提供了对并行算法的高层的抽象描述,程序员通过在源代码中加入专用的pragma来指明自己的意图,由此编译器可以自动将程序进行并行化,并在必要之处加入同步互斥以及通信。当选择忽略这些pragma,或者编译器不支持OpenMP时,程序又可退化为通常的程序(一般为串行),代码仍然可以正常运作,只是不能利用多线程来加速程序执行。
1. OpenMP在X86 Linux上的展现:
例子代码:
#include
int main(int argc, char* argv[])
{
#pragma omp parallel
printf("Hello, world.\n");
return 0;
}
普通编译:
g++ OpenMP_Test.cpp -o test
运行:
# ./test
Hello, world.
增加OpenMP 编译选项的编译:
g++ -fopenmp OpenMP_Test.cpp -o test
运行:
#./test
Hello, world.
Hello, world.
Hello, world.
Hello, world.
证明-fopenmp在GCC下有效。代码的OpenMP能力得到支持。
#pragma ompparallel 仅在您指定了
-fopenmp编译器选项后才会发挥作用。在编译期间,GCC会根据硬件和操作系统配置在运行时生成代码,创建尽可能多的线程。每个线程的起始例程为代码块中位于指令之后的代码。这种行为是 隐式的并行化,而OpenMP本质上由一组功能强大的编译指示组成,帮您省去了编写大量样本文件的工作。我的Linux机器为4核CPU。所有有4个thread.
2. OpenMP在ARM-Anrdoid-NDK上的展现:
代码不变。
Android.mk内容如下:
LOCAL_PATH := $(call my-dir)
include $(CLEAR_VARS)
LOCAL_ARM_MODE := arm
LOCAL_MODULE := test
LOCAL_SRC_FILES := OpenMP_Test.cpp
LOCAL_CXXFLAGS := -fopenmp
LOCAL_CFLAGS += -fopenmp
LOCAL_LDLIBS := -llog -fopenmp
include $(BUILD_EXECUTABLE)
Application.mk内容如下:
# Build both ARMv5TE and ARMv7-A machine code.
APP_PLATFORM = android-8
APP_ABI := armeabi-v7a
#APP_ABI := $(ARM_ARCH)
#Sam modify it to release
#APP_OPTIM := release
APP_OPTIM := debug
#APP_OPTIM = $(MY_OPTIM)
APP_CPPFLAGS += -fexceptions
APP_CPPFLAGS += -frtti
#sam modify it from gnustl_static to gnustl_shared
#APP_STL := gnustl_static
#APP_STL := gnustl_shared
APP_STL := gnustl_shared
#APP_CPPFLAGS += -fno-rtti
#
APP_CPPFLAGS += -Dlinux -fsigned-char
APP_CFLAGS += -fsigned-char
#APP_CPPFLAGS += $(MY_CPPFLAGS) -Dlinux
#STLPORT_FORCE_REBUILD := true
编译后运行:
$./test
Hello, world.
Hello, world.
Hello, world.
Hello, world.
证明-fopenmp在NDK下有效。代码的OpenMP能力得到支持。
K1平台是4 Core的。所以有4个thread.
3. OpenCV4AndroidOpenMP支持:
#!/bin/sh
cd `dirname $0`/..
mkdir -p build_android_arm
cd build_android_arm
cmake -DCMAKE_BUILD_WITH_INSTALL_RPATH=ON-DHAVE_EIGEN=1 -DHAVE_CAMV4L2=ON -DBUILD_TBB=ON-DWITH_TBB=ON
-DHAVE_OPENMP=1 -DBUILD_EXA
MPLES=1 -DANDROID_ABI="armeabi-v7a" -DCMAKE_TOOLCHAIN_FILE=../android/android.toolchain.cmake $@../..
只要如此编译,则OpenCV 支持OpenMP.
4. OpenMP 指令和库函数:
C/C++中,OpenMP指令的使用格式为:
#pragmaomp 指令 [子句[子句]…]
#pragma omp parallel for
for (int j = 0; j < 4; j++)
{
printf("j=[%d], ThreadId =[%d]\n", j, omp_get_thread_num());
}
#endif
如果报找不到符号,可以:-lgom
总结一下,在pc上,时间加倍,但是在arm多核上,效果可以,时间减少约50%。
相关文章推荐
- OpenMP在ARM-Linux以及NDK中的编译和使用
- arm-linux-gcc-4.4.3交叉编译google的protobuf。以及使用方法
- 交叉编译环境以及开发板上-/bin/sh: ./hello: not found(使用arm-linux-gcc -static -o 来进行静态编译)
- 【ndk】直接使用ndk提供的arm-linux-androideabi-gcc编译android可执行程序
- 关于使用arm-linux-gnueabihf-gcc工具链编译多线程
- windows下编译ffmpeg2.5——使用VS2013,ARMLINUX,ANDORID编译ffmpeg
- linux 命令行下 使用android sdk 以及ndk
- GDB arm-linux交叉编译移植和使用方法(特别是对于正在运行的程序或者段错误的程序进行分析)
- 不使用Cygwin,在eclipse中快速开发JNI,一键生成C头文件.h,以及一键使用NDK交叉编译
- 使用ARM开发详细步骤/关于QT/E安装,编译,以及执行
- Cross compile gdbserver and use it in ARM linux (在ARM uClinux下编译和使用gdbserver)
- Linux下使用NDK编译FFMPEG(libstagefright)
- 使用arm-linux-gcc3.4.6重新编译移植QTE4.6.3
- 在Fedora18下用cross-ng1.9.3建立arm-linux交叉编译环境在s3c6410上使用
- Linux环境下node.js环境的搭建以及配置,使用node.js编写工具与简化less编译
- arm-linux-gcc交叉编译工具链的制作及使用
- Ubuntu 16.04(64bit)嵌入式交叉编译环境搭建arm-linux-gcc使用
- 使用Eclipse+NDK编译arm64-v8a CPU架构的speex.so文件
- 使用uclibc的buildroot制作交叉编译工具链 ,arm-linux-gcc
- qt4.8.6版本使用arm-linux-gcc-3.4.5编译问题