Android opencv笔记

Mac环境下opencv for android笔记

想不到时隔一年,又要接触NDK了。。。
首先按照 在Android Studio中安装OpenCV mac环境/Linux环境 小试了一把。

JNI Tip

jni的文件夹名必须是作者截图中的jniLibs(因为这个是Gradle默认的JNI文件夹),不然System.loadLibrary方法会报错。也可以用另一个属性 jniLibs.srcDirs = ['libs'] 设置,这样的话就把JNI文件放到与src同级的libs文件夹。
另外,只需要复制要支持的cpu架构的文件夹。如果只需要调用opencv中封装好的JNI接口,文件夹中只保留opencv_java.so这个文件。

opencv 初始化

调用 OpenCVLoader.initAsync() 的话会检测 OpenCVManager 这个程序有没有安装,没有就会引导用户安装。OpenCVManager里包含的是你要调用的各种so文件,一应俱全。
但这样显然会影响用户体验,所以推荐另一个初始化方法 OpenCVLoader.initDebug()
这个方法基本等同于 System.loadLibrary("opencv_java")
opencv_java是我们上一步放到jniLibs下的libopencv_java.so文件, 包含了所有opencv封装的JNI接口。
如果你还需要使用其他so文件,可以使用 System.loadLibrary继续加载。这样,初始化的逻辑就搞清楚了。初始化可以在onResume(),或者static 代码块里执行。

基本数据结构和概念解释

opencV的Imgproc有很多模糊函数, 它们都需要传入Size参数。参数名为ksize, 是kernel size的缩写,即滤波器模板(核)的尺寸。构造函数 Size(w,h) w 为像素宽度, h为像素高度。Size(3,3)就是3 3的核。像Size和blockSize这种,边长还是设置成2,5,7等奇数比较好理解。虽然有时候2 2也可以设置,但不知道和3*3有啥区别。

  • Scalar
  •      public Scalar</font>(double v0) {
            val = new double[] { v0, 0, 0, 0 };
    
          以上面单个参数的构造方法为例,可以看出是一个size为4的一维数组。应用举例:
    
          //与一维数组相乘,所以结果是第一个通道(ARGB的话就是alpha通道)的值被放大一百倍,其他通道的值变为0
         Core.multiply(mat1, new Scalar(100), mat1);
    
  • Sobel
  •      //这个构造函数的dx指的是x方向求导的阶数,dy指的是y方向求导的阶数。ddepth指的是输出图像的深度。
         public static void Sobel(Mat src, Mat dst, 
         int ddepth, int dx, int dy, int ksize,
          double scale, double delta);
    Mat即矩阵(Matrix)的缩写, 是保存图像像素信息的矩阵。它主要包含两部分:矩阵头和一个指向像素数据的矩阵指针。代码示例:
    
    //构造一个3*3卷积核,8位无符号整型单通道。
    Mat kernel= new Mat( 3, 3, CvType.CV_8UC1);
    //前两个参数表示操作起始坐标,为(0,0),之后的参数为填充数据[0,-1, 0,-1, 5,-1, 0,-1, 0] 
    //因为是单通道,所以9个数刚好能填满。如果是4通道,就需要9*4才能填满。
    kernel. put( 0, 0, 0,-1, 0,-1, 5,-1, 0,-1, 0); 
    

    得到的卷积核如下

    以检测直线为例,
    通过定义理解:
    笛卡尔坐标系的点(X, Y)对应着经过它的无数条直线,这无数条直线在p-θ平面上(p轴代表直线截距,θ代表直线夹角)上可以用一条直线表示。把笛卡尔坐标系的大量的点都映射到p-θ平面上,就有了大量直线。如果p-θ平面上存在大量直线在某个点相交,就说明笛卡尔坐标系包含一条直线,直线的斜率和截距对应着此点的p和θ。

    通过公式理解:
    其实,笛卡尔坐标系的直线公式转化一下,也能得出结论,就是个相对的思维。
    用y = kx+b表示笛卡尔坐标系的任意一条直线,这样x, y, k, b 都是未知数了。
    而b 和k 通过三角函数可以转化成p和θ,
    暂且用b = f(p,θ)和 k = g(p,θ)
    这样,直线y = kx+b上的点,虽然每一个点都能在p-θ平面上映射无数条直线,但必定每个点映射的直线必定有一条是
    f(p,θ) = y- g(p,θ)x
    笛卡尔坐标系里,确定y = kx+b的参数值,只需要两个在这条直线上的不同的点的坐标(x0,y0), (x1,y1)
    把同样的(x0,y0), (x1,y1)带入到方程f(p,θ) = y- g(p,θ)x,就可以求出p, θ的值了。所以,笛卡尔坐标系的直线就对应着p-θ平面上的一个点。

    在检测圆的过程中,发现Imgproc.HoughCircles方法居然会改变输入的Mat, 也就是第一个参数。而且如果采用new Mat()的方法生成Mat, 并且不是第一个Mat, 就可能会影响之前的Mat。而调用Mat.zeros方法就不会影响。暂时当作opencv4Android的一个bug吧,C++版本应该没这么明显的bug。

    在JNI中调用openCV

    在JNI中使用openCV时,如果报错imread imwrite等undefined reference, 可能是因为编译时STL配置的问题,需要使用gnustl_shared: Recently, NDK switched to libc++ as default STL, but OpenCV is built with gnustl

    YUV21转RGB

    先了解常见的视频格式:
    视频存储格式YUV420 NV12 NV21 i420 YV12

    YUV21转RGB的方法有很多种, 效率对比如下:
    【视频处理】YUV与RGB格式转换
    Android libyuv应用系列(二)libyuv在Android中的使用
    使用libyuv对YUV数据进行缩放,旋转,镜像,裁剪等操作
    (libYUV的话需要先将相机的NV21(YUV420sp)数据转成I420(YUV420P) )
    最后觉得OpenCV的方式既高保真, 速度也快, 也提供了镜像/旋转之类的接口,接入也方便:
    android + java opencv + Mat与byte[]互换

    JNI打印Mat信息:

    void printMAtMessage(Mat &mat) {
        LOGD("printMAtMessage","***************************Mat信息开始************************");
        LOGD("printMAtMessage","mat.rows %d",mat.rows);
        LOGD("printMAtMessage","mat.cols %d",mat.cols);
        LOGD("printMAtMessage","mat.total %d",mat.total());
        LOGD("printMAtMessage","mat.channels %d",mat.channels());
        LOGD("printMAtMessage","mat.depth %d",mat.depth());
        LOGD("printMAtMessage","mat.type %d",mat.type());
        LOGD("printMAtMessage","mat.flags %d",mat.flags);
        LOGD("printMAtMessage","mat.elemSize %d",mat.elemSize());
        LOGD("printMAtMessage","mat.elemSize1 %d",mat.elemSize1());
        LOGD("printMAtMessage","mat.data[0] %d",mat.data[0]);
        LOGD("printMAtMessage","mat.data[1] %d",mat.data[1]);
        LOGD("printMAtMessage","mat.data[mat.total()*mat.elemSize()-1]) %d",mat.data[mat.total()*mat.elemSize()-1]);
        LOGD("printMAtMessage","mat.data[mat.cols*mat.elemSize()-1] %d",mat.data[mat.cols*mat.elemSize()-1]);
        LOGD("printMAtMessage","mat.data[mat.total()*mat.elemSize()-mat.cols*mat.elemSize()] %d",mat.data[mat.total()*mat.elemSize()-mat.cols*mat.elemSize()]);
        LOGD("printMAtMessage","***************************Mat信息结束************************");
    
  • OpenCV 二进制文件和RGB图像互转:
  • RGB图像转二进制文件 // imread()导入图片时是BGR通道顺序 cv::Mat sourceImage = cv::imread("xxx.png");// 当前文件的相对路径或者绝对路径 if (sourceImage.empty()) return -1; cv::Mat bgr; //OpenCV操作图片时经常需要拷贝一份操作,避免修改原数据; sourceImage.copyTo(bgr); FILE* fpw = fopen("C:\\Users\\xxx\\Desktop\\RGB.txt", "wb"); // wb write as binary file // 字符模式(w模式)打开的文件,在windows下,遇到0x0A进行写入(也就是\n)会替换为0x0D和0x0A(分别是\r和\n) if (fpw == NULL) return -1; // write image to binary format file int rows = bgr.rows; // 高 int cols = bgr.cols; // 宽 uint8_t* dp = (uint8_t*)bgr.data;// for (int i = 0; i < rows * cols; i++) fwrite(&dp[i * 3], sizeof(uint8_t), 1, fpw); fwrite(&dp[i * 3 + 1], sizeof(uint8_t), 1, fpw); fwrite(&dp[i * 3 + 2], sizeof(uint8_t), 1, fpw); // 或者一行搞定write // fwrite(dp, rows * cols * 3, 1, fpw);// 1 byte 即sizeof(uint8_t) // 或者 fwrite(dp, bgr.step * rows, 1, fpw); // cv::Mat::step 即mat矩阵的每一行的字节数,BGR3字节,即cv::Mat::step = bgr.cols * 3 fclose(fpw) 二进制文件转RGB //CV_8UC3 is an 8-bit unsigned integer matrix/image with 3 channels Mat zeroImg = Mat::zeros(width, height, CV_8UC3);//创建像素值全为0的图像 // BGR格式的二进制图像数据, rb read as binary file FILE* fpr = fopen("C:\\Users\\xxx\\Desktop\\BRG_Binary.txt", "rb"); if (fpr == NULL) return -1;