gpt4 book ai didi

ruby-on-rails - 在 Rails 应用程序中导入 XML 文件,UTF-16 编码问题

转载 作者:太空宇宙 更新时间:2023-11-03 16:40:16 25 4
gpt4 key购买 nike

我正在尝试通过 Ruby on Rails 应用程序中的网页导入 XML 文件,代码 ruby​​ View 代码如下(我删除了 HTML 布局标签以便于阅读代码)

<% form_for( :fmfile, :url => '/fmfiles', :html => { :method => :post, :name => 'Form_Import_DDR', :enctype => 'multipart/form-data' } ) do |f| %>
<%= f.file_field :document, :accept => 'text/xml', :name => 'fmfile_document' %>
<%= submit_tag 'Import DDR' %>
<% end %>

以下 HTML 形式的结果

<form action="/fmfiles" enctype="multipart/form-data" method="post" name="Form_Import_DDR"><div style="margin:0;padding:0"><input name="authenticity_token" type="hidden" value="3da97372885564a4587774e7e31aaf77119aec62" />
<input accept="text/xml" id="fmfile_document" name="fmfile_document" size="30" type="file" />
<input name="commit" type="submit" value="Import DDR" />
</form>

“fmfiles_controller”中的 Form_Import_DDR 方法是使用 REXML 执行读取 XML 文档的艰苦工作的代码。代码如下

@fmfile = Fmfile.new
@fmfile.user_id = current_user.id
@fmfile.file_group_id = 1
@fmfile.name = params[:fmfile_document].original_filename

respond_to do |format|
if @fmfile.save
require 'rexml/document'
doc = REXML::Document.new(params[:fmfile_document].read)

doc.root.elements['File'].elements['BaseTableCatalog'].each_element('BaseTable') do |n|
@base_table = BaseTable.new
@base_table.base_table_create(@fmfile.user_id, @fmfile.id, n)
end

它继续读取所有不同的 XML 元素。

我在 Mac OS X 10.5.4 的开发环境中使用 Rails 2.1.0 和 Mongrel 1.1.5,站点数据库和浏览器在同一台机器上。

我的问题是这样的。整个过程在读取字符编码为 UTF-8 的 XML 文档时工作正常,但在 XML 文件为 UTF-16 时失败,有谁知道为什么会发生这种情况以及如何停止这种情况?

我在下面包含了调试器控制台的错误输出,获取此输出大约需要 5 分钟,浏览器在以下输出“无法打开页面”之前超时

Processing FmfilesController#create (for 127.0.0.1 at 2008-09-15 16:50:56) [POST]
Session ID: BAh7CDoMdXNlcl9pZGkGOgxjc3JmX2lkIiVmM2I3YWU2YWI4ODU2NjI0NDM2
NTFmMDE1OGY1OWQxNSIKZmxhc2hJQzonQWN0aW9uQ29udHJvbGxlcjo6Rmxh
c2g6OkZsYXNoSGFzaHsABjoKQHVzZWR7AA==--dd9f588a68ed628ab398dd1a967eedcd09e505e0
Parameters: {"commit"=>"Import DDR", "authenticity_token"=>"3da97372885564a4587774e7e31aaf77119aec62", "action"=>"create", "fmfile_document"=>#<File:/var/folders/LU/LU50A0vNHA07S4rxDAOk4E+++TI/-Tmp-/CGI.3001.1>, "controller"=>"fmfiles"}
[4;36;1mUser Load (0.000350)[0m [0;1mSELECT * FROM "users" WHERE (id = 1) LIMIT 1[0m
[4;35;1mFmfile Create (0.000483)[0m [0mINSERT INTO "fmfiles" ("name", "file_group_id", "updated_at", "report_created_at", "report_link", "report_version", "option_on_open_account_name", "user_id", "option_default_custom_menu_set", "option_on_close_script", "path", "report_type", "option_on_open_layout", "option_on_open_script", "created_at") VALUES('TheTest_fp7 2.xml', 1, '2008-09-15 15:50:56', NULL, NULL, NULL, NULL, 1, NULL, NULL, NULL, NULL, NULL, NULL, '2008-09-15 15:50:56')[0m

REXML::ParseException (#<Iconv::InvalidCharacter: "਼䙍偒数 (followed by a few thousand similar looking chinese characters)
䙍偒数潲琾", ["\n"]>
/Library/Ruby/Site/1.8/rexml/encodings/ICONV.rb:7:in `conv'
/Library/Ruby/Site/1.8/rexml/encodings/ICONV.rb:7:in `decode'
/Library/Ruby/Site/1.8/rexml/source.rb:50:in `encoding='
/Library/Ruby/Site/1.8/rexml/parsers/baseparser.rb:210:in `pull'
/Library/Ruby/Site/1.8/rexml/parsers/treeparser.rb:21:in `parse'
/Library/Ruby/Site/1.8/rexml/document.rb:190:in `build'
/Library/Ruby/Site/1.8/rexml/document.rb:45:in `initialize'

最佳答案

与其说是 rails/mongrel 问题,不如说是您的 XML 文件或 REXML 处理它的方式有问题。您可以通过编写一个简短的脚本来直接读取您的 XML 文件(而不是在请求中)并查看它是否仍然失败来检查这一点。

假设是这样,我会考虑几件事。首先,我会检查您运行的是最新版本的 REXML。几年前,在其 UTF-16 处理中存在一个错误 ( http://www.germane-software.com/projects/rexml/ticket/63 )。

我要检查的第二件事是你的问题是否与此类似:http://groups.google.com/group/rubyonrails-talk/browse_thread/thread/ba7b0585c7a6330d .如果是这样,您可以尝试该线程中的解决方法。

如果以上方法都没有帮助,请回复并提供更多信息,例如您在尝试读取文件时遇到的异常。

关于ruby-on-rails - 在 Rails 应用程序中导入 XML 文件,UTF-16 编码问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63632/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com