gpt4 book ai didi

c++ - 使用 libclang 从内存中的 C 代码生成程序集

转载 作者:太空狗 更新时间:2023-10-29 20:37:25 24 4
gpt4 key购买 nike

我需要使用 LLVM/Clang 作为后端来实现一个将 C 代码编译为 eBPF 字节码的库。这些代码将从内存中读取,我也需要在内存中获取生成的汇编代码。

到目前为止,我已经能够使用以下代码编译为 LLVM IR:

#include <string>
#include <vector>

#include <clang/Frontend/CompilerInstance.h>
#include <clang/Basic/DiagnosticOptions.h>
#include <clang/Frontend/TextDiagnosticPrinter.h>
#include <clang/CodeGen/CodeGenAction.h>
#include <clang/Basic/TargetInfo.h>
#include <llvm/Support/TargetSelect.h>

using namespace std;
using namespace clang;
using namespace llvm;

int main() {

constexpr auto testCodeFileName = "test.cpp";
constexpr auto testCode = "int test() { return 2+2; }";

// Prepare compilation arguments
vector<const char *> args;
args.push_back(testCodeFileName);

// Prepare DiagnosticEngine
DiagnosticOptions DiagOpts;
TextDiagnosticPrinter *textDiagPrinter =
new clang::TextDiagnosticPrinter(errs(),
&DiagOpts);
IntrusiveRefCntPtr<clang::DiagnosticIDs> pDiagIDs;
DiagnosticsEngine *pDiagnosticsEngine =
new DiagnosticsEngine(pDiagIDs,
&DiagOpts,
textDiagPrinter);

// Initialize CompilerInvocation
CompilerInvocation *CI = new CompilerInvocation();
CompilerInvocation::CreateFromArgs(*CI, &args[0], &args[0] + args.size(), *pDiagnosticsEngine);

// Map code filename to a memoryBuffer
StringRef testCodeData(testCode);
unique_ptr<MemoryBuffer> buffer = MemoryBuffer::getMemBufferCopy(testCodeData);
CI->getPreprocessorOpts().addRemappedFile(testCodeFileName, buffer.get());


// Create and initialize CompilerInstance
CompilerInstance Clang;
Clang.setInvocation(CI);
Clang.createDiagnostics();

// Set target (I guess I can initialize only the BPF target, but I don't know how)
InitializeAllTargets();
const std::shared_ptr<clang::TargetOptions> targetOptions = std::make_shared<clang::TargetOptions>();
targetOptions->Triple = string("bpf");
TargetInfo *pTargetInfo = TargetInfo::CreateTargetInfo(*pDiagnosticsEngine,targetOptions);
Clang.setTarget(pTargetInfo);

// Create and execute action
// CodeGenAction *compilerAction = new EmitLLVMOnlyAction();
CodeGenAction *compilerAction = new EmitAssemblyAction();
Clang.ExecuteAction(*compilerAction);

buffer.release();
}

为了编译,我使用以下 CMakeLists.txt:

cmake_minimum_required(VERSION 3.3.2)
project(clang_backend CXX)

set(CMAKE_CXX_COMPILER "clang++")

execute_process(COMMAND llvm-config --cxxflags OUTPUT_VARIABLE LLVM_CONFIG OUTPUT_STRIP_TRAILING_WHITESPACE)
execute_process(COMMAND llvm-config --libs OUTPUT_VARIABLE LLVM_LIBS OUTPUT_STRIP_TRAILING_WHITESPACE)

set(CMAKE_CXX_FLAGS ${LLVM_CONFIG})

set(CLANG_LIBS clang clangFrontend clangDriver clangSerialization clangParse
clangCodeGen clangSema clangAnalysis clangEdit clangAST clangLex
clangBasic )

add_executable(clang_backend main.cpp)
target_link_libraries(clang_backend ${CLANG_LIBS})
target_link_libraries(clang_backend ${LLVM_LIBS})

如果我理解正确,如果我将编译器操作更改为 EmitAssemblyAction(),我应该能够生成汇编代码,但我可能没有初始化某些东西,因为我在 llvm::TargetPassConfig::中遇到段错误:在/tmp/llvm-3.7.1.src/lib/CodeGen/Passes.cpp:419 添加PassesToHandleExceptions (this=this@entry=0x6d8d30)

这一行的代码是:

switch (TM->getMCAsmInfo()->getExceptionHandlingType()) {

有没有人有例子或知道我错过了什么?

最佳答案

所以,如果你编译 LLVM 时启用断言,错误就更清楚了,它实际上会告诉你你需要做什么:

x: .../src/llvm/lib/CodeGen/LLVMTargetMachine.cpp:63: 
void llvm::LLVMTargetMachine::initAsmInfo():
Assertion `TmpAsmInfo && "MCAsmInfo not initialized. "
"Make sure you include the correct TargetSelect.h"
"and that InitializeAllTargetMCs() is being invoked!"' failed.

(我添加了一些换行符,因为它打印为一个长行)。

main 的开头添加所需的 InitializeAllTargetMCs() 后,我又遇到了一个错误。查看我的编译器生成的目标文件,我“猜测”这是另一个 InitializeAll* 调用的问题。进行了一些测试,结果表明您还需要 InitializeAllAsmPrinters(); - 如果您要生成汇编代码,这是有道理的。

我不完全确定如何从您的代码中“查看”结果,但是将这两个添加到 main 的开头使其运行完成而不是断言、退出并出现错误或崩溃 - 这通常是朝着正确方向迈出的良好一步。

所以这是 main 在“我的”代码中的样子:

int main() {

constexpr auto testCodeFileName = "test.cpp";
constexpr auto testCode = "int test() { return 2+2; }";

InitializeAllTargetMCs();
InitializeAllAsmPrinters();

// Prepare compilation arguments
vector<const char *> args;
args.push_back(testCodeFileName);

// Prepare DiagnosticEngine
DiagnosticOptions DiagOpts;
TextDiagnosticPrinter *textDiagPrinter =
new clang::TextDiagnosticPrinter(errs(),
&DiagOpts);
IntrusiveRefCntPtr<clang::DiagnosticIDs> pDiagIDs;
DiagnosticsEngine *pDiagnosticsEngine =
new DiagnosticsEngine(pDiagIDs,
&DiagOpts,
textDiagPrinter);

// Initialize CompilerInvocation
CompilerInvocation *CI = new CompilerInvocation();
CompilerInvocation::CreateFromArgs(*CI, &args[0], &args[0] + args.size(), *pDiagnosticsEngine);

// Map code filename to a memoryBuffer
StringRef testCodeData(testCode);
unique_ptr<MemoryBuffer> buffer = MemoryBuffer::getMemBufferCopy(testCodeData);
CI->getPreprocessorOpts().addRemappedFile(testCodeFileName, buffer.get());


// Create and initialize CompilerInstance
CompilerInstance Clang;
Clang.setInvocation(CI);
Clang.createDiagnostics();

// Set target (I guess I can initialize only the BPF target, but I don't know how)
InitializeAllTargets();
const std::shared_ptr<clang::TargetOptions> targetOptions = std::make_shared<clang::TargetOptions>();
targetOptions->Triple = string("bpf");
TargetInfo *pTargetInfo = TargetInfo::CreateTargetInfo(*pDiagnosticsEngine,targetOptions);
Clang.setTarget(pTargetInfo);

// Create and execute action
// CodeGenAction *compilerAction = new EmitLLVMOnlyAction();
CodeGenAction *compilerAction = new EmitAssemblyAction();
Clang.ExecuteAction(*compilerAction);

buffer.release();
}

我强烈建议,如果您想使用 clang&LLVM 进行开发,请构建 Clang&LLVM 的调试版本 - 这将有助于追踪“原因”并及早发现问题以及更明显的问题。将 -DCMAKE_BUILD_TYPE=Debugcmake 一起使用以获得那种 flavor 。

我用于构建 LLVM 和 Clang 的完整脚本:

export CC=clang
export CXX=clang++
cmake -DCMAKE_BUILD_TYPE=Debug -DCMAKE_INSTALL_PREFIX=/usr/local/llvm-debug -DLLVM_TAR
GETS_TO_BUILD=X86 ../llvm

[我使用的是 3.8 的后期预发布版本来测试它,但我非常怀疑它在这方面与 3.7.1 有很大不同]

关于c++ - 使用 libclang 从内存中的 C 代码生成程序集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34828480/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com