问题 如何在不知道Rcpp类型的情况下处理向量


我想复制以下R函数 Rcpp

fR = function(x) x[1:2]

fR(c(1,2,3))
#[1] 1 2
fR(c('a','b','c'))
#[1] "a" "b"

我可以这样做固定输出类型:

library(inline)
library(Rcpp)

fint = cxxfunction(signature(x = "SEXP"), '
          List xin(x);
          IntegerVector xout;

          for (int i = 0; i < 2; ++i) xout.push_back(xin[i]);

          return xout;', plugin = "Rcpp")

但这只适用于整数,如果我尝试更换 xout 输入 List (要么 GenericVector,它是相同的) - 它适用于任何输入类型,但我回来了 list 而不是矢量。

什么是正确的 Rcpp 这样做的方式?


3240
2017-11-06 22:12


起源



答案:


不要用 push_back 上 Rcpp 类型。当前实现Rcpp向量的方式需要每次都复制所有数据。这是一项非常昂贵的操作。

我们有 RCPP_RETURN_VECTOR 对于调度,这需要您编写一个模板函数,将Vector作为输入。

#include <Rcpp.h>
using namespace Rcpp ;

template <int RTYPE>
Vector<RTYPE> first_two_impl( Vector<RTYPE> xin){
    Vector<RTYPE> xout(2) ;
    for( int i=0; i<2; i++ ){
        xout[i] = xin[i] ;    
    }
    return xout ;
}

// [[Rcpp::export]]
SEXP first_two( SEXP xin ){
  RCPP_RETURN_VECTOR(first_two_impl, xin) ;
}

/*** R
    first_two( 1:3 )
    first_two( letters )
*/

只是 sourceCpp 这个文件,这也将运行调用这两个函数的R代码。实际上,模板可能更简单,这也可以工作:

template <typename T>
T first_two_impl( T xin){
    T xout(2) ;
    for( int i=0; i<2; i++ ){
        xout[i] = xin[i] ;    
    }
    return xout ;
}

模板参数 T 只需要:

  • 一个构造函数 int 
  • 一个 operator[](int)

或者,这可能是一项工作 dplyr 矢量访客。

#include <dplyr.h>
// [[Rcpp::depends(dplyr,BH)]]

using namespace dplyr ;
using namespace Rcpp ;

// [[Rcpp::export]]
SEXP first_two( SEXP data ){
    VectorVisitor* v = visitor(data) ;
    IntegerVector idx = seq( 0, 1 ) ;
    Shield<SEXP> out( v->subset(idx) ) ;
    delete v ;
    return out ;
}

访问者允许您在向量上执行一组操作,而不管它包含的数据类型。

> first_two(letters)
[1] "a" "b"

> first_two(1:10)
[1] 1 2

> first_two(rnorm(10))
[1] 0.4647190 0.9790888

9
2017-11-07 06:33



@eddi我已经使用dplyr的vector visitor添加了一个替代方案。可能是你想要的。 - Romain Francois
谢谢罗曼。我将看看dplyr,但独立于此我建议为你添加任意数量的参数 RCPP_RETURN_VECTOR 宏(我必须为我的真实用例做)。 - eddi
请在此处提交拉取请求: github.com/RcppCore/Rcpp 或者向我们发送补丁或在我们的问题跟踪器中开始讨论: github.com/RcppCore/Rcpp/issues - Romain Francois
@eddi你是如何添加获取任意数量参数的能力的 RCPP_RETURN_VECTOR?我对自己这样做非常感兴趣但是有很少的c ++经验。 - stanekam
@iShouldUseAName看到这篇文章: stackoverflow.com/q/679979/817778 - eddi


答案:


不要用 push_back 上 Rcpp 类型。当前实现Rcpp向量的方式需要每次都复制所有数据。这是一项非常昂贵的操作。

我们有 RCPP_RETURN_VECTOR 对于调度,这需要您编写一个模板函数,将Vector作为输入。

#include <Rcpp.h>
using namespace Rcpp ;

template <int RTYPE>
Vector<RTYPE> first_two_impl( Vector<RTYPE> xin){
    Vector<RTYPE> xout(2) ;
    for( int i=0; i<2; i++ ){
        xout[i] = xin[i] ;    
    }
    return xout ;
}

// [[Rcpp::export]]
SEXP first_two( SEXP xin ){
  RCPP_RETURN_VECTOR(first_two_impl, xin) ;
}

/*** R
    first_two( 1:3 )
    first_two( letters )
*/

只是 sourceCpp 这个文件,这也将运行调用这两个函数的R代码。实际上,模板可能更简单,这也可以工作:

template <typename T>
T first_two_impl( T xin){
    T xout(2) ;
    for( int i=0; i<2; i++ ){
        xout[i] = xin[i] ;    
    }
    return xout ;
}

模板参数 T 只需要:

  • 一个构造函数 int 
  • 一个 operator[](int)

或者,这可能是一项工作 dplyr 矢量访客。

#include <dplyr.h>
// [[Rcpp::depends(dplyr,BH)]]

using namespace dplyr ;
using namespace Rcpp ;

// [[Rcpp::export]]
SEXP first_two( SEXP data ){
    VectorVisitor* v = visitor(data) ;
    IntegerVector idx = seq( 0, 1 ) ;
    Shield<SEXP> out( v->subset(idx) ) ;
    delete v ;
    return out ;
}

访问者允许您在向量上执行一组操作,而不管它包含的数据类型。

> first_two(letters)
[1] "a" "b"

> first_two(1:10)
[1] 1 2

> first_two(rnorm(10))
[1] 0.4647190 0.9790888

9
2017-11-07 06:33



@eddi我已经使用dplyr的vector visitor添加了一个替代方案。可能是你想要的。 - Romain Francois
谢谢罗曼。我将看看dplyr,但独立于此我建议为你添加任意数量的参数 RCPP_RETURN_VECTOR 宏(我必须为我的真实用例做)。 - eddi
请在此处提交拉取请求: github.com/RcppCore/Rcpp 或者向我们发送补丁或在我们的问题跟踪器中开始讨论: github.com/RcppCore/Rcpp/issues - Romain Francois
@eddi你是如何添加获取任意数量参数的能力的 RCPP_RETURN_VECTOR?我对自己这样做非常感兴趣但是有很少的c ++经验。 - stanekam
@iShouldUseAName看到这篇文章: stackoverflow.com/q/679979/817778 - eddi


你需要选择一种类型(即不要使用 signature="SEXP" [哦,无论如何你应该看看属性])。

或者你保持 SEXP 类型,并在内部发送。例如,参见 这篇文章在Rcpp画廊

编辑: C当然是静态类型的。这些非常依赖于类型的开关也遍布R源。这里没有免费午餐。


0
2017-11-06 22:23



我不知道手前的类型。我正在学习使用Rcpp并且tbh发现令人惊讶的是我需要为上面这么简单的事情做整个if / else构造 - 我尝试使用Rcpp的主要原因是 不 做那些东西: - - eddi
您似乎忽略了C ++是一种强类型语言的事实。 - Dirk Eddelbuettel
我刚刚注意到Rcpp糖提到了一个 head 功能,也许这个 是 没有if / else的可行吗? - eddi
这使用了更多涉及的模板编程。 - Dirk Eddelbuettel
使用模板和包装函数的类似帖子,而不是内联调度: gallery.rcpp.org/articles/fast-factor-generation。 - Kevin Ushey