您好,请问下您测试的数据规模是多大?另外提供下您的完整的同步程序代码,及编译命令。通常情况下,同步代码如果加上-O3或-O2选项,会自动进行排流水。详细请参考:https://www.cambricon.com/docs/bangc_bestpractice/7_loop_pipeline/7_loop_pipeline.html#mlu
参照例程 BANG/bang-c++/union4/pipeline_nmem_union4。写了一个测试程序,与测试例程有些差别。
测试发现使用异步传输,运行时间跟同步传输一样。请问是哪里写的有问题吗?
异步传输相关的代码行号:35~37, 45,46, 73~77, 80.
请登录后评论