ARM-ассемблер XE5

← →
DevilDevil © (2014-01-02 12:02) [0]

Позволяет ли XE5 писать на ассемблере под ARM-архитектуру ?
Имеется ли возможность в отладчике смотреть последовательность сгенерированных ARM-команд из ЯВУ ?
Имеется ли возможность всё это делать, за PC, не используя дополнительные девайсы ?

← →
DVM © (2014-01-02 14:11) [1]

> DevilDevil © (02.01.14 12:02)
> Позволяет ли XE5 писать на ассемблере под ARM-архитектуру
> ?

Нельзя.

← →
DevilDevil © (2014-01-02 15:53) [2]

у меня нет ни ARM-дивайсов, нет ARM-компилятора
делаю что-то типа ассемблерного компилятора, под x86-x64-ARM
и на данный момент пытаюсь определить, каким образом запрограммировать оптимизацию и реализацию прыжков, чтобы потом можно было припаять ARM, не перекраивая архитектуру.

Русскоязычной литературы мало, читаю Т.Мартин "Микроконтроллеры ARM7...", но там по ассемблеру мало. В англоязычных источниках много непонятных слов :). К тому же важно учитывать, что технологии и подходы движутся, мне интересен актуальный ARM-ассемблер для айфонов, айпадов и андроидов.

Не мог бы ты ответить сам (если можешь) или может спросить у кого...
- как реализуется call/ret (вызов/возврат) функции
- применимы ли короткие/длинные прыжки? (логика подсказывает, что смотреть надо надо на Thumb-2, но опять таки не известно, как он применяется на практике)
- как осуществляются прыжки на расстояние свыше 24Мб

← →
RWolf © (2014-01-02 16:10) [3]

имхо, если уж взялся за компилятор под архитектуру, таких вопросов возникать не должно.
в документации на arm.com всё есть.

← →
Rouse_ © (2014-01-02 16:13) [4]

> DevilDevil © (02.01.14 15:53) [2]

Родную документацию, конечно смотрел?
http://infocenter.arm.com/help/topic/com.arm.doc.dui0068b/DUI0068.pdf

← →
DevilDevil © (2014-01-02 16:18) [5]

> RWolf © (02.01.14 16:10) [3]
> имхо, если уж взялся за компилятор под архитектуру, таких
> вопросов возникать не должно.в документации на arm.com всё есть.

Для ARM я буду делать ещё не известно когда. Сейчас мучаю оптимизацию/реализацию прыжков для x86-x64. Но сдаётся мне, можно сделать универсальный подход. Вот поэтому и интересуюсь

← →
DevilDevil © (2014-01-02 16:23) [6]

> Rouse_ © (02.01.14 16:13) [4]

Вопрос больше не об ARM в общем, а об ARM в Delphi.
ARM поддерживает Jazzele, но в Delphi-то его нет

← →
Rouse_ © (2014-01-02 16:26) [7]

Дельфя компилит код в LLVM, собственно это тебе и ответ на вопрос. LLVM конечно позволяет использовать асм вставки но не в том виде в котором ты привык. А родной арм код получается только вторым проходом из LLVM.

← →
RWolf © (2014-01-02 16:26) [8]

для начала, единой архитектуры ARM нет, а есть архитектуры v4, v4T с Thumb, v5, v6, v7 с Thumb-2, v8 с 64-бит набором, и все более-менее в ходу, и кодогенерация в них существенно отличается.

← →
Rouse_ © (2014-01-02 16:27) [9]

Да и кстати, из какого ЯВУ ты компилятор делаеш-то?

← →
DevilDevil © (2014-01-02 16:36) [10]

> Rouse_ © (02.01.14 16:27) [9]
> Да и кстати, из какого ЯВУ ты компилятор делаеш-то?

Ты неправильно понял. Смысл этого всего будет понятен, когда наконец выйдет ApolloXML
В данном случае, если XE5 позволяет смотреть сгенерированные ассемблерные команды (Ctrl+C), то на вопросы выше можно ответить

← →
DevilDevil © (2014-01-02 16:40) [11]

> RWolf © (02.01.14 16:26) [8]

а XE5 под какой процессор компилирует ?

← →
DevilDevil © (2014-01-02 16:40) [12]

* под какую версию ARM

← →
Rouse_ © (2014-01-02 16:57) [13]

> DevilDevil © (02.01.14 16:40) [12]
> * под какую версию ARM

AFAIK сейчас ARMv7

← →
DevilDevil © (2014-01-02 17:05) [14]

Получается нужно найти того, у кого есть XE5
И попросить его внести больше ясности :)

← →
Rouse_ © (2014-01-02 18:17) [15]

Не просто ХЕ5, а с возможностью такой разработки. Там одна из дорогих версий пакета такое умеет делать. Проф точно не умеет. Хотя, впрочем, у Керка точно есть какая нужна (MVP все-же) можешь его попинать и он даже должен (ес я не ошибаюсь) тебе такие моменты разьяснить :)

← →
DevilDevil © (2014-01-02 18:48) [16]

> Rouse_ © (02.01.14 18:17) [15]

Ну пинать я никого не буду :)
У нас вроде как сообщество программистов. Увидит, будет желание внести ясность - ради бога. Нет - так чё человека заставлять :)

← →
Kerk © (2014-01-02 19:08) [17]

В интернетах пишут, что ARM v7.

В самой XE5 я могу легко посмотреть, если мне скажете куда смотреть. Компилятор называется dccarm.exe, как узнать о нем больше информации, я сходу не понял :)

Если есть желание самому попробовать XE5, то можно смело брать триальную версию. Триал представляет собой САМУЮ полную версию Delphi (Architect вроде), но без исходников и с ограничением по времени конечно же.

← →
DevilDevil © (2014-01-02 19:16) [18]

> Если есть желание самому попробовать XE5, то можно смело
> брать триальную версию. Триал представляет собой САМУЮ полную
> версию Delphi (Architect вроде), но без исходников и с ограничением
> по времени конечно же.

Боюсь мой древний комп не потянет пятую версию. На работу ещё выходить не скоро, к тому же там свои траблы будут

> В интернетах пишут, что ARM v7.

ясно

> В самой XE5 я могу легко посмотреть, если мне скажете куда
> смотреть. Компилятор называется dccarm.exe, как узнать о
> нем больше информации, я сходу не понял :)

дизассемблируй пожалуйста (команды ассемблера и бинарное представление) вот эту функцию
и подтверди предположение, что функция вызывается по команде bl
function Test(const X, Y: integer): integer; begin if (X < Y) then begin Result := $01020304; end else begin Result := ((X*Y)*(X-Y+5) mod Y) + $87654321; end; end;

← →
Rouse_ © (2014-01-02 19:58) [19]

> и подтверди предположение, что функция вызывается по команде
> bl

BL это аналог CALL в арме, там по логике так и должно быть сгенерено.

← →
Rouse_ © (2014-01-02 20:00) [20]

Хотя там может и BLCC и аналоги быть (а чаму-бы и нет?)

← →
DevilDevil © (2014-01-02 20:05) [21]

> Rouse_ ©

я знаю. Просто хочу услышать этому подтверждение :) Мож там blx какой-нибудь

← →
Rouse_ © (2014-01-02 20:29) [22]

Я думаю что даже если он и подтвердит что присутствует инструкция BL, тебе не стоит на нее полагаться. Ибо не забывай оптимизирующую составляющую.

К примеру.

mov eax, 1
mov edx, 2
call Test

даст BL

а

mov eax, 1
mov edx, 2
cmp ecx, 0
jne @1
call Test
@1:

может привести к свертке Jx инструкции и вызову BLCC (образно)

← →
DevilDevil © (2014-01-02 20:46) [23]

> Rouse_ ©

Ты не в ту степь уходишь. Я знаю про существование blcc. Сейчас это наименее значимый вопрос

← →
RWolf © (2014-01-02 21:25) [24]

> [18]

держи:
28 int Test(int &X, int &Y) 29 { 30 if (X < Y) \ _Z4TestRiS_: \ 00000000 0x6809 LDR R1,[R1, #+0] \ 00000002 0x6800 LDR R0,[R0, #+0] \ 00000004 0x4288 CMP R0,R1 \ 00000006 0xDA02 BGE.N ??Test_0 31 { 32 return 0x01020304; \ 00000008 0x.... 0x.... LDR.W R0,??DataTable21_3 \ 0000000C 0x4770 BX LR 33 } 34 else 35 { 36 return ((X*Y)*(X-Y+5) % Y) + 0x87654321; \ ??Test_0: \ 0000000E 0xFB01 0xF200 MUL R2,R1,R0 \ 00000012 0x1A40 SUBS R0,R0,R1 \ 00000014 0x1D40 ADDS R0,R0,#+5 \ 00000016 0x4350 MULS R0,R0,R2 \ 00000018 0xFB90 0xF2F1 SDIV R2,R0,R1 \ 0000001C 0xFB01 0x0012 MLS R0,R1,R2,R0 \ 00000020 0x.... 0x.... LDR.W R1,??DataTable21_4 \ 00000024 0x1808 ADDS R0,R1,R0 \ 00000026 0x4770 BX LR 37 } 38 }

← →
DevilDevil © (2014-01-02 21:47) [25]

> RWolf ©

дак это ж не Delphi
и с каких пор в ARM появилась команда деления ?
и... почему у тебя команды 2х байтные ?

p.s. неточность: X и Y передаются по значению

← →
RWolf © (2014-01-02 21:51) [26]

> [25]

это эквивалентный код на Си.
const — это передача по ссылке.
команда деления, потому что v7.
двухбайтные, потому что Thumb-2.
может, всё-таки, сначала почитать даташиты?

← →
Rouse_ © (2014-01-02 22:06) [27]

> может, всё-таки, сначала почитать даташиты?

+146, Димыч, начинать нужно с макулатуры.
Это у тебя еще плевая задачка, оть мне сразу после НГ за три недели нужно будет умудриться впихнуть в 9 кб памяти железки полноценный AES на ARM асме - вот это засада та еще. А тут так - лишь бы разобраться :)

← →
DevilDevil © (2014-01-02 22:09) [28]

> RWolf © (02.01.14 21:51) [26]

> это эквивалентный код на Си.
я ценю
но в данном случае значительно важнее, как компилируется в Delphi

> const — это передача по ссылке.

Если размер структуры превышает размер регистра.
В данном случае по значению
К тому же & - это аналог var

> команда деления, потому что v7.

Не ожидал
Везде пишут, что деления в ARM-е нет

> двухбайтные, потому что Thumb-2.

т.е. в тренде компилировать Thumb-2 ?
в Delphi так же ?

> может, всё-таки, сначала почитать даташиты?

почитай
и давай без наездов

← →
DevilDevil © (2014-01-02 22:11) [29]

> Rouse_ © (02.01.14 22:06) [27]
> +146, Димыч, начинать нужно с макулатуры.

Ну дак я и начал с неё. Который день уже штудирую разные источники ;)
Решил, что наиболее правильное решение - подсмотреть за компилятором Delphi

← →
Rouse_ © (2014-01-02 22:13) [30]

> DevilDevil © (02.01.14 22:11) [29]
> Ну дак я и начал с неё. Который день уже штудирую разные
> источники ;)

Который день - мало, каждый день и много дней - это уже что-то :)

← →
RWolf © (2014-01-02 22:23) [31]

> но в данном случае значительно важнее, как компилируется
> в Delphi

почему это должно быть важно, если пишется свой компилятор?

> т.е. в тренде компилировать Thumb-2 ?

в v7 других наборов вообще нет.

> почитай

мне незачем, я эти листинги каждый день вижу.

> и давай без наездов

просто не люблю шапкозакидательского подхода типа «начнём писать компилятор,а набор инструкций потом выучим».

← →
DevilDevil © (2014-01-02 22:35) [32]

> почему это должно быть важно, если пишется свой компилятор?

Потому что мой "компилятор" на данный момент рассчитан на 3 режима: бинарный, текстовый (ассемблер) и гибрид. Вполне вероятно, что позже добавятся какие-нибудь dcu и obj. Так вот гибрид рассчитан на использование в Delphi. И меня в первую очередь интересует, как устроено в Delphi.

> просто не люблю шапкозакидательского подхода типа «начнём
> писать компилятор,а набор инструкций потом выучим».

На данный момент я ничего не пишу для ARM. В данный момент я пишу оптимизацию и реализацию прыжков в архитектурах x86 и x64. И я хочу сейчас понять, что можно сделать универсально, а что придётся прописывать для конкретной архитектуры. И я заинтересован в том, чтобы потом не было копипасты, или, что ещё хуже, перекраивания архитектуры "компилятора"

В частности важно, в тренде Thumb-2 или нет. Потому что если да - нужно закладывать короткие 2х байтные прыжки. Если нет - то только длинные. А ещё оказывается нужно предусматривать ситуации, когда прыжок выходит за диапазон +- 32Мб. С этим тоже что-то нужно делать. Закладываться нужно уже сегодня. Всплывает так много неожиданной информации, которую надо аккуратненько уложить в приемлемую архитектуру :)

← →
DevilDevil © (2014-01-02 22:41) [33]

Что такое гибрид...
Я не точно, но показательно постараюсь продемонстрировать...

int Test(int &X, int &Y) __asm { DD 0x68096800, 0x4288DA02 LDR.W R0,??DataTable21_3 DD 0x4770FB01, 0xF2001A40, 0x1D404350, 0xFB90F2F1, 0xFB010012 LDR.W R1,??DataTable21_4 DD 0x18084770 }

← →
RWolf © (2014-01-02 23:02) [34]

Нужно много чего предусматривать заранее. Например, то, что, в отличие от x86, в коде необходимы literal pools, и они не должны быть далеко от использующего их кода из-за ограничений относительной адресации. Если заранее об этом не позаботиться, потом придётся обвешивать кодогенератор костылями.
Именно поэтому перед написанием транслятора нужно ознакомиться с архитектурой.

← →
DevilDevil © (2014-01-02 23:21) [35]

> RWolf © (02.01.14 23:02) [34]

так то оно так
только для реализации/оптимизации прыжков мне это пока не нужно
нужна информация по прыжкам
самое главное - используется ли (в тренде ли :) Thumb-2 в Delphi :)

куда запропастился Kerk ?

← →
Германн © (2014-01-03 02:29) [36]

> Rouse_ © (02.01.14 22:06) [27]
>
>
> > может, всё-таки, сначала почитать даташиты?
>
> +146, Димыч, начинать нужно с макулатуры.
> Это у тебя еще плевая задачка, оть мне сразу после НГ за
> три недели нужно будет умудриться впихнуть в 9 кб памяти
> железки полноценный AES

9КБ это же до х** и больше. Или я что-то не понимаю?

← →
DevilDevil © (2014-01-03 22:59) [37]

Ребят, а подскажите пожалуйста ещё, где посмотреть, как бинарно образуются те или иные команды (ARM)
Вот возьмём к примеру x86-64. Прыжки есть условные и безусловные, короткие и большие. Все короткие занимают по 2 байта. Длинные - 5 байт безусловный, 6 байт условный. Отсчёт смещения идёт после команды. На диапазон смещения для коротких прыжков выделяется 8 старших бит: -127..+128

Вот такую же информацию хочу посмотреть по ARMv7, но пока не нахожу

← →
DevilDevil © (2014-01-03 23:08) [38]

очепятка :)

-128...+127 :)

← →
Kerk © (2014-01-04 17:09) [39]

> DevilDevil © (02.01.14 23:21) [35]
>
> куда запропастился Kerk ?

Дык праздники же :)

На моем основном ноутбуке как оказалось после установки второго апдейта для XE5 отломался андроидный отладчик. Причины буду потом выяснять. Собственно, отсюда и задержка с ответом.

Тут вызов функции:
http://s3.hostingkartinok.com/uploads/images/2014/01/e7584c130b11cf51fb024fe47f3310f7.png

Тут сама функция:
http://s3.hostingkartinok.com/uploads/images/2014/01/ade3e13f4d2ae6809605b5da7766f4ef.png

Unit1.pas.27: begin 5C13F0C8 80B5 push {r7, lr} 5C13F0CA 6F46 mov r7, sp 5C13F0CC 88B0 sub sp, #32 5C13F0CE 0491 str r1, [sp, #16] 5C13F0D0 0390 str r0, [sp, #12] Unit1.pas.27: begin 5C13F0D2 0498 ldr r0, [sp, #16] 5C13F0D4 0690 str r0, [sp, #24] 5C13F0D6 0399 ldr r1, [sp, #12] 5C13F0D8 0791 str r1, [sp, #28] Unit1.pas.28: if (X < Y) then 5C13F0DA 0798 ldr r0, [sp, #28] 5C13F0DC 0699 ldr r1, [sp, #24] 5C13F0DE 8842 cmp r0, r1 5C13F0E0 0DDB blt.n 0x5c13f0fe <Unit1.Test(int, int)+54> 5C13F0E2 FFE7 b.n 0x5c13f0e4 <Unit1.Test(int, int)+28> Unit1.pas.33: Result := ((X*Y)*(X-Y+5) mod Y) + $87654321; 5C13F0E4 0798 ldr r0, [sp, #28] 5C13F0E6 0699 ldr r1, [sp, #24] 5C13F0E8 00FB01F2 mul.w r2, r0, r1 5C13F0EC 401A subs r0, r0, r1 5C13F0EE 0530 adds r0, #5 5C13F0F0 5043 muls r0, r2 5C13F0F2 0029 cmp r1, #0 5C13F0F4 0291 str r1, [sp, #8] 5C13F0F6 0190 str r0, [sp, #4] 5C13F0F8 07D0 beq.n 0x5c13f10a <Unit1.Test(int, int)+66> 5C13F0FA 08E0 b.n 0x5c13f10e <Unit1.Test(int, int)+70> Unit1.pas.35: end; 5C13F0FC 15E0 b.n 0x5c13f12a <Unit1.Test(int, int)+98> 5C13F0FE 40F20430 movw r0, #772 ; 0x304 5C13F102 C0F20210 movt r0, #258 ; 0x102 Unit1.pas.30: Result := $01020304; 5C13F106 0590 str r0, [sp, #20] 5C13F108 F8E7 b.n 0x5c13f0fc <Unit1.Test(int, int)+52> Unit1.pas.33: Result := ((X*Y)*(X-Y+5) mod Y) + $87654321; 5C13F10A E5F7C1DD bl 0x5b924c90 <System._IntDivByZero()> 5C13F10E 44F22130 movw r0, #17185 ; 0x4321 5C13F112 C8F26570 movt r0, #34661 ; 0x8765 5C13F116 0199 ldr r1, [sp, #4] 5C13F118 0090 str r0, [sp, #0] 5C13F11A 0846 mov r0, r1 5C13F11C 0299 ldr r1, [sp, #8] 5C13F11E 0CF0F8EA blx 0x5c14b710 <__modsi3> 5C13F122 0099 ldr r1, [sp, #0] 5C13F124 0844 add r0, r1 5C13F126 0590 str r0, [sp, #20] 5C13F128 E8E7 b.n 0x5c13f0fc <Unit1.Test(int, int)+52> Unit1.pas.35: end; 5C13F12A 0598 ldr r0, [sp, #20]

← →
Rouse_ © (2014-01-04 18:03) [40]

> Германн © (03.01.14 02:29) [36]
> 9КБ это же до х** и больше. Или я что-то не понимаю?

Вероятно не понимаешь, ибо обычный MD5 занимает в районе 10 кб, а тут цельный AES

← →
DevilDevil © (2014-01-04 18:07) [41]

> Kerk © (04.01.14 17:09) [39]

Хууухх, смотрите-ка
Действительно получается, что кодогенерация идёт в Thumb-2: команды двухбайтные или четырёхбайтные

Спасибо!

Только вот понять не могу, почему команд столько много... Это же вроде LLVM, там нормальная оптимизация должна быть... Посмотри для сравнения [24]

← →
DVM © (2014-01-04 18:18) [42]

> Rouse_ © (04.01.14 18:03) [40]

> ибо обычный MD5 занимает в районе 10 кб, а тут цельный AES

AES занимает не сильно больше, но там 5 таблиц по 256 байт - уже больше килобайта, а так то алгоритм не сложный, визуально проще чем MD5.

← →
RWolf © (2014-01-04 18:25) [43]

> [40]

и как только у меня в бутлодере AES всего в килобайт умещается.

← →
Rouse_ © (2014-01-04 21:09) [44]

> RWolf © (04.01.14 18:25) [43]
> и как только у меня в бутлодере AES всего в килобайт умещается.

К этому и иду :)

← →
RWolf © (2014-01-04 22:07) [45]

> [44]

так оно без особенных стараний так вышло, взял на atmel.com код из одноимённой аппноты для AVR и пересобрал под ARM.

← →
bems © (2014-01-04 22:53) [46]

> AES занимает не сильно больше, но там 5 таблиц по 256 байт

с-боксы не обязательно хранить в табличном виде, можно генерить нужный элемент по необходимости

← →
DVM © (2014-01-05 01:14) [47]

> bems © (04.01.14 22:53) [46]

можно конечно, но учитывая жесткие ограничения по памяти можно предположить, что там и скорость вычислений соответствующая, медленно может оказаться.

← →
Inovet © (2014-01-05 01:43) [48]

> [37] DevilDevil © (03.01.14 22:59)
> Прыжки

Почему прыжки? Всё-таки их как-то принято называть переходами.

← →
DevilDevil © (2014-01-05 02:50) [49]

> Inovet © (05.01.14 01:43) [48]

потому что я знаю как переводится "Jump"
и "прыжок" подходит по смыслу значительно больше, чем "переход"

← →
Германн © (2014-01-05 03:03) [50]

> Rouse_ © (04.01.14 18:03) [40]
>
>
> > Германн © (03.01.14 02:29) [36]
> > 9КБ это же до х** и больше. Или я что-то не понимаю?
>
> Вероятно не понимаешь, ибо обычный MD5 занимает в районе
> 10 кб, а тут цельный AES

На каком языке "обычный MD5" занимает 10 КБ?
И для какого процессора?
И как эта процедура реализована?

P.S. Имхо 9КБ программной памяти для микропроцессора это не скажу что офигенное количество памяти, но скажу что весьма немалое. Даже на 8-ми битном процессоре можно наваять весьма сложные алгоритмы.

> [49] DevilDevil © (05.01.14 02:50)
> потому что я знаю как переводится «Jump»
> и «прыжок» подходит по смыслу значительно больше, чем «переход»

Я тоже знаю перевод, а насчёт смысла вопрос вкусовщины и в немалой степени традиции, во всяком случае прыжок по-русски режет ухо.

Ну раз уж Inovet поднял тему... А что теперь вместо, например, фраз "условный переход" и "безусловный переход" модно говорить "условный прыжок" и "безусловный прыжок"? Насчет ушей Inovet прав, имхо.

> Германн © (05.01.14 03:03) [50]
> На каком языке "обычный MD5" занимает 10 КБ?

Дык на твоей родной дельфе, зря ты вчера не приехал на шашлыки к нам в офис, я там Зотычу это дело наглядно демонстрировал, и IDA и ключик и размер по которому я утыкаюсь :)

> DevilDevil © (05.01.14 13:49) [52]
> мне "переход" режет ухо. мне очень даже не режет слух "прыжок"

Это то-же что и с нить/поток (Thread/Stream) так уж исторически сложилось.
Правда хоть я и придерживаюсь терминологии Нить в отношении TThread, иснстукции JXX все-же называю переходами (ибо Керк правильно сказал, "условный прыжок" как-то режет слух)

Предлагаю на печатных платах «джамперы» переводить как прыжки. Например «jumper-free» переводить «свободная от прыгунов», а то «без перемычек» как-то несовременно звучит.

> RWolf © (04.01.14 22:07) [45]
>
> > [44]
>
> так оно без особенных стараний так вышло, взял на atmel.
> com код из одноимённой аппноты для AVR и пересобрал под
> ARM.

Чет не получилось, вышел на 9 082, мошт что с настройками не так. Ты как собирал?

> Rouse_ © (05.01.14 17:55) [56]

aes.lst:
IAR ANSI C/C++ Compiler V6.40.4.54170/W32 for ARM 22/Feb/2013 17:29:45 Copyright 1999-2012 IAR Systems AB. Cpu mode = thumb Endian = little Source file = C:\xxx\Src\aes.cpp Command line = C:\xxx\Src\aes.cpp -lCN C:\xxx\IAR\Release\List\ -lB C:\xxx\IAR\Release\List\ -o C:\xxx\IAR\Release\Obj\ --debug --endian=little --cpu=Cortex-M3 -e --fpu=None --dlib_config "C:\Program Files\IAR\EW6\arm\INC\c\DLib_Config_Normal.h" -I C:\xxx\IAR\..\S rc\ -I C:\xxx\IAR\..\..\Src\ -I C:\xxx\IAR\..\..\..\Inc\ -Ohz --eec++ List file = C:\xxx\IAR\Release\List\aes.lst Object file = C:\xxx\IAR\Release\Obj\aes.o ... Section sizes: Bytes Function/Label ----- -------------- 4 ?<Constant {(byte)"\001", (byte)"\000", (byte) 4 ??DataTable5 4 ??DataTable5_1 4 ??DataTable5_2 8 ?Subroutine0 14 CopyBytes(byte *, byte *, unsigned int) 366 InvMixColumn(byte *) 50 InvShiftRows(byte *) 24 InvSubBytesAndXOR(byte *, byte *, unsigned int) 194 KeyExpansion(byte *) 20 SubBytes(byte *, unsigned int) 20 XORBytes(byte *, byte *, unsigned int) 118 aesDecrypt(unsigned char *, unsigned char *) 154 aesInit(unsigned char *) 268 block1 powTbl logTbl sBoxInv 256 block2 32 kTable 8 sBox expandedKey 532 bytes in section .bss 1 016 bytes in section .text

http://upload.wikimedia.org/wikipedia/commons/d/d7/О.п._Кавголово._Подземный_переход.JPG

Эмнь... А вот тут просадки рзве не будет? "--fpu=None"

> [59] DevilDevil © (05.01.14 18:08)
> http://upload.wikimedia.org/wikipedia/commons/d/d7/О.п._Кавголово._Подземный_переход.JPG

Ну что, тунельные переходы весьма достойны, даже чем-то могут показаться мистичны, и казались таковыми не так давно  невозможно пройти, а вот раз и прошёл.

> RWolf © (05.01.14 18:20) [61]
>
> > Rouse_ © (05.01.14 18:09) [60]
>
> я для Cortex-M3 пишу, она без FPU.
> да и алгоритм целочисленный.

Ага, понятно, еще раз сеньк, покумекаю...

> RWolf © (05.01.14 18:20) [61]

Небольшой вопрос, а можно чуть попозже я у тебя пару консультаций возьму (если возникнут затруднения) и, конечно, платные. (За знания нужно всегда платить звонкой монетой :)

> а вот раз и прошёл.

это к вопросу "переходов"
мож конечно в русскоязычной литературе устоялся термин "условный переход"
но для меня "переход" термин неверный. верный - "прыжок"
в общем мы оба правы. только я правее

а вообще я пишу(ал) обычно jmp/jcc - и всё автоматически становилось понятно

"прыжки" режут у вас ухо
а "переход" режет мою логику и воображение. Это как медиков педиками назвать, а продавцов дисков на рынке назвать программистами

> [64]

стучись в джаббер r-wolf на ya.ru.

В общем посоветовали мне вот этот справочник: http://lcs3.syr.edu/faculty/yin/teaching/CIS700-sp11/arm_architecture_reference_manual_errata_markup_8_0.pdf
Особенно обратите внимание на раздел A8.6.16
Пришли к выводу, что ЯВУ компилирует в режиме Thumb. Часть команд 16-битные, часть 32-битные
В справочнике нужно смотреть на варианты "Encoding T..." и полностью игнорировать "Encoding A..."

Теперь вернёмся к моей текущей задаче

В конечном счёте есть последовательность команд, некоторые из них прыжки. Каждая команда имеет размер. Поначалу все прыжки инициализируются как большие. Т.е. call 5 байт, jmp 5 байт, jcc 6 байт. Все ARM прыжки (бранчи) инициализируются 4 байтами. По идее должно хватить и длинного прыжка, но в крайнем случае можно будет 4х-байтной командой командой напрямую загрузить pc из участка памяти.

Ну так вот. Один из этапов моей либы - это сжатие прыжков. И я хочу сделать универсальный подход для платформ x86, x64 и ARMv7, ну как минимум само сжатие больших прыжков к малым. Определён тип condition и по каждому условию будет какая-то информационная структура. В итоге получится таблица.

Что я хотел бы вас попросить мне помочь. Сконцентрируемся на задаче (опишу сильно упрощено, но смысл сохраняется):
Есть команда-прыжок. Я знаю её смещение относительно начала функции. У меня есть condition (тип) прыжка. Я знаю на сколько байт (от начала команды) должен быть совершён прыжок. Задача - определить, можно ли "сжать" прыжок. И если да - то каким образом прописать смещение в результирующую бинарную команду.

Вот в x86-64 все просто.
call не сжимаются
диапазон для jcc: -126..131. signed char offset = (OFFSET<0)?OFFSET+2:OFFSET-4; // было 6, стало 2 диапазон для jmp: -126..130. signed char offset = (OFFSET<0)?OFFSET+2:OFFSET-3; // было 5, стало 2

А для ARMv7 пока понять не могу. Просьба помочь
Ситуация усложняется тем, что у меня нет компилятора-дебагера, и сейчас я не смогу проверить догадку, кроме как на примере функции выше

очепяточка

диапазон для jcc: -126..131 signed char offset = (OFFSET<0)?OFFSET-2:OFFSET-4; // было 6, стало 2 диапазон для jmp: -126..130 signed char offset = (OFFSET<0)?OFFSET-2:OFFSET-3; // было 5, стало 2

В общем с учётом полученных знаний об архитектуре ARM получилось определить следующую формулу.

диапазон для b<c>: -252..260 signed char offset = ((OFFSET<0)?OFFSET-4:OFFSET-4-2) >> 1;

И для прыжка на положительное смещение вроде бы подходит
Смотрим пример RWolf © (02.01.14 21:25) [24]

BGE происходит из 6 в 14 (E). Если бы прыжок был большим - то из 6 в 16, OFFSET = 10
offset = (10-4-2) >> 1 = 2. Верно

Давайте постараемся проверить корректность для прыжка на отрицательное расстояние.
RWolf, Kerk, не могли бы вы привести листинг какого-нибудь цикла с постусловием ?

ARM-ассемблер XE5 Найти похожие ветки