PageRenderTime 79ms CodeModel.GetById 25ms RepoModel.GetById 0ms app.codeStats 1ms

/security/nss/lib/freebl/mpi/montmulfv9.s

http://github.com/zpao/v8monkey
Assembly | 2380 lines | 2308 code | 72 blank | 0 comment | 22 complexity | 372b9ac3da56c404731d9b3376e645f5 MD5 | raw file
Possible License(s): MPL-2.0-no-copyleft-exception, LGPL-3.0, AGPL-1.0, LGPL-2.1, BSD-3-Clause, GPL-2.0, JSON, Apache-2.0, 0BSD
  1. !
  2. ! ***** BEGIN LICENSE BLOCK *****
  3. ! Version: MPL 1.1/GPL 2.0/LGPL 2.1
  4. !
  5. ! The contents of this file are subject to the Mozilla Public License Version
  6. ! 1.1 (the "License"); you may not use this file except in compliance with
  7. ! the License. You may obtain a copy of the License at
  8. ! http://www.mozilla.org/MPL/
  9. !
  10. ! Software distributed under the License is distributed on an "AS IS" basis,
  11. ! WITHOUT WARRANTY OF ANY KIND, either express or implied. See the License
  12. ! for the specific language governing rights and limitations under the
  13. ! License.
  14. !
  15. ! The Original Code is SPARC hand-optimized Montgomery multiply functions.
  16. !
  17. ! The Initial Developer of the Original Code is
  18. ! Sun Microsystems Inc.
  19. ! Portions created by the Initial Developer are Copyright (C) 1999-2000
  20. ! the Initial Developer. All Rights Reserved.
  21. !
  22. ! Contributor(s):
  23. !
  24. ! Alternatively, the contents of this file may be used under the terms of
  25. ! either the GNU General Public License Version 2 or later (the "GPL"), or
  26. ! the GNU Lesser General Public License Version 2.1 or later (the "LGPL"),
  27. ! in which case the provisions of the GPL or the LGPL are applicable instead
  28. ! of those above. If you wish to allow use of your version of this file only
  29. ! under the terms of either the GPL or the LGPL, and not to allow others to
  30. ! use your version of this file under the terms of the MPL, indicate your
  31. ! decision by deleting the provisions above and replace them with the notice
  32. ! and other provisions required by the GPL or the LGPL. If you do not delete
  33. ! the provisions above, a recipient may use your version of this file under
  34. ! the terms of any one of the MPL, the GPL or the LGPL.
  35. !
  36. ! ***** END LICENSE BLOCK *****
  37. .section ".text",#alloc,#execinstr
  38. .file "montmulf.c"
  39. .section ".rodata",#alloc
  40. .global TwoTo16
  41. .align 8
  42. !
  43. ! CONSTANT POOL
  44. !
  45. .global TwoTo16
  46. TwoTo16:
  47. .word 1089470464
  48. .word 0
  49. .type TwoTo16,#object
  50. .size TwoTo16,8
  51. .global TwoToMinus16
  52. !
  53. ! CONSTANT POOL
  54. !
  55. .global TwoToMinus16
  56. TwoToMinus16:
  57. .word 1055916032
  58. .word 0
  59. .type TwoToMinus16,#object
  60. .size TwoToMinus16,8
  61. .global Zero
  62. !
  63. ! CONSTANT POOL
  64. !
  65. .global Zero
  66. Zero:
  67. .word 0
  68. .word 0
  69. .type Zero,#object
  70. .size Zero,8
  71. .global TwoTo32
  72. !
  73. ! CONSTANT POOL
  74. !
  75. .global TwoTo32
  76. TwoTo32:
  77. .word 1106247680
  78. .word 0
  79. .type TwoTo32,#object
  80. .size TwoTo32,8
  81. .global TwoToMinus32
  82. !
  83. ! CONSTANT POOL
  84. !
  85. .global TwoToMinus32
  86. TwoToMinus32:
  87. .word 1039138816
  88. .word 0
  89. .type TwoToMinus32,#object
  90. .size TwoToMinus32,8
  91. .section ".text",#alloc,#execinstr
  92. /* 000000 0 */ .register %g3,#scratch
  93. /* 000000 */ .register %g2,#scratch
  94. /* 000000 0 */ .align 8
  95. !
  96. ! SUBROUTINE conv_d16_to_i32
  97. !
  98. ! OFFSET SOURCE LINE LABEL INSTRUCTION
  99. .global conv_d16_to_i32
  100. conv_d16_to_i32:
  101. /* 000000 */ save %sp,-208,%sp
  102. ! FILE montmulf.c
  103. ! 1 !/*
  104. ! 2 ! * The contents of this file are subject to the Mozilla Public
  105. ! 3 ! * License Version 1.1 (the "License"); you may not use this file
  106. ! 4 ! * except in compliance with the License. You may obtain a copy of
  107. ! 5 ! * the License at http://www.mozilla.org/MPL/
  108. ! 6 ! *
  109. ! 7 ! * Software distributed under the License is distributed on an "AS
  110. ! 8 ! * IS" basis, WITHOUT WARRANTY OF ANY KIND, either express or
  111. ! 9 ! * implied. See the License for the specific language governing
  112. ! 10 ! * rights and limitations under the License.
  113. ! 11 ! *
  114. ! 12 ! * The Original Code is SPARC optimized Montgomery multiply functions.
  115. ! 13 ! *
  116. ! 14 ! * The Initial Developer of the Original Code is Sun Microsystems Inc.
  117. ! 15 ! * Portions created by Sun Microsystems Inc. are
  118. ! 16 ! * Copyright (C) 1999-2000 Sun Microsystems Inc. All Rights Reserved.
  119. ! 17 ! *
  120. ! 18 ! * Contributor(s):
  121. ! 19 ! * Netscape Communications Corporation
  122. ! 20 ! *
  123. ! 21 ! * Alternatively, the contents of this file may be used under the
  124. ! 22 ! * terms of the GNU General Public License Version 2 or later (the
  125. ! 23 ! * "GPL"), in which case the provisions of the GPL are applicable
  126. ! 24 ! * instead of those above. If you wish to allow use of your
  127. ! 25 ! * version of this file only under the terms of the GPL and not to
  128. ! 26 ! * allow others to use your version of this file under the MPL,
  129. ! 27 ! * indicate your decision by deleting the provisions above and
  130. ! 28 ! * replace them with the notice and other provisions required by
  131. ! 29 ! * the GPL. If you do not delete the provisions above, a recipient
  132. ! 30 ! * may use your version of this file under either the MPL or the
  133. ! 31 ! * GPL.
  134. ! 32 ! *
  135. ! 33 ! * $Id: montmulfv9.s,v 1.5 2006/12/11 09:45:32 gerv%gerv.net Exp $
  136. ! 34 ! */
  137. ! 36 !#define RF_INLINE_MACROS
  138. ! 38 !static const double TwoTo16=65536.0;
  139. ! 39 !static const double TwoToMinus16=1.0/65536.0;
  140. ! 40 !static const double Zero=0.0;
  141. ! 41 !static const double TwoTo32=65536.0*65536.0;
  142. ! 42 !static const double TwoToMinus32=1.0/(65536.0*65536.0);
  143. ! 44 !#ifdef RF_INLINE_MACROS
  144. ! 46 !double upper32(double);
  145. ! 47 !double lower32(double, double);
  146. ! 48 !double mod(double, double, double);
  147. ! 50 !void i16_to_d16_and_d32x4(const double * /*1/(2^16)*/,
  148. ! 51 ! const double * /* 2^16*/,
  149. ! 52 ! const double * /* 0 */,
  150. ! 53 ! double * /*result16*/,
  151. ! 54 ! double * /* result32 */,
  152. ! 55 ! float * /*source - should be unsigned int*
  153. ! 56 ! converted to float* */);
  154. ! 58 !#else
  155. ! 60 !static double upper32(double x)
  156. ! 61 !{
  157. ! 62 ! return floor(x*TwoToMinus32);
  158. ! 63 !}
  159. ! 65 !static double lower32(double x, double y)
  160. ! 66 !{
  161. ! 67 ! return x-TwoTo32*floor(x*TwoToMinus32);
  162. ! 68 !}
  163. ! 70 !static double mod(double x, double oneoverm, double m)
  164. ! 71 !{
  165. ! 72 ! return x-m*floor(x*oneoverm);
  166. ! 73 !}
  167. ! 75 !#endif
  168. ! 78 !static void cleanup(double *dt, int from, int tlen)
  169. ! 79 !{
  170. ! 80 ! int i;
  171. ! 81 ! double tmp,tmp1,x,x1;
  172. ! 83 ! tmp=tmp1=Zero;
  173. ! 84 ! /* original code **
  174. ! 85 ! for(i=2*from;i<2*tlen-2;i++)
  175. ! 86 ! {
  176. ! 87 ! x=dt[i];
  177. ! 88 ! dt[i]=lower32(x,Zero)+tmp1;
  178. ! 89 ! tmp1=tmp;
  179. ! 90 ! tmp=upper32(x);
  180. ! 91 ! }
  181. ! 92 ! dt[tlen-2]+=tmp1;
  182. ! 93 ! dt[tlen-1]+=tmp;
  183. ! 94 ! **end original code ***/
  184. ! 95 ! /* new code ***/
  185. ! 96 ! for(i=2*from;i<2*tlen;i+=2)
  186. ! 97 ! {
  187. ! 98 ! x=dt[i];
  188. ! 99 ! x1=dt[i+1];
  189. ! 100 ! dt[i]=lower32(x,Zero)+tmp;
  190. ! 101 ! dt[i+1]=lower32(x1,Zero)+tmp1;
  191. ! 102 ! tmp=upper32(x);
  192. ! 103 ! tmp1=upper32(x1);
  193. ! 104 ! }
  194. ! 105 ! /** end new code **/
  195. ! 106 !}
  196. ! 109 !void conv_d16_to_i32(unsigned int *i32, double *d16, long long *tmp, int ilen)
  197. ! 110 !{
  198. ! 111 !int i;
  199. ! 112 !long long t, t1, a, b, c, d;
  200. ! 114 ! t1=0;
  201. ! 115 ! a=(long long)d16[0];
  202. /* 0x0004 115 */ ldd [%i1],%f2
  203. ! 116 ! b=(long long)d16[1];
  204. ! 117 ! for(i=0; i<ilen-1; i++)
  205. /* 0x0008 117 */ sub %i3,1,%o1
  206. /* 0x000c 110 */ or %g0,%i0,%g1
  207. /* 0x0010 116 */ ldd [%i1+8],%f4
  208. /* 0x0014 117 */ cmp %o1,0
  209. /* 0x0018 114 */ or %g0,0,%g5
  210. /* 0x001c 115 */ fdtox %f2,%f2
  211. /* 0x0020 */ std %f2,[%sp+2247]
  212. /* 0x0024 117 */ or %g0,0,%o0
  213. /* 0x0028 116 */ fdtox %f4,%f2
  214. /* 0x002c */ std %f2,[%sp+2239]
  215. /* 0x0030 110 */ sub %o1,1,%o7
  216. /* 0x0034 */ or %g0,%i1,%o4
  217. /* 0x0038 */ sethi %hi(0xfc00),%o3
  218. /* 0x003c */ or %g0,-1,%o1
  219. /* 0x0040 */ or %g0,2,%i1
  220. /* 0x0044 */ srl %o1,0,%g3
  221. /* 0x0048 */ or %g0,%o4,%g4
  222. /* 0x004c 116 */ ldx [%sp+2239],%i2
  223. /* 0x0050 */ add %o3,1023,%o5
  224. /* 0x0054 117 */ sub %o7,1,%o2
  225. /* 0x0058 115 */ ldx [%sp+2247],%i3
  226. /* 0x005c 117 */ ble,pt %icc,.L900000113
  227. /* 0x0060 */ sethi %hi(0xfc00),%g2
  228. /* 0x0064 */ add %o7,1,%g2
  229. ! 118 ! {
  230. ! 119 ! c=(long long)d16[2*i+2];
  231. ! 120 ! t1+=a&0xffffffff;
  232. ! 121 ! t=(a>>32);
  233. ! 122 ! d=(long long)d16[2*i+3];
  234. ! 123 ! t1+=(b&0xffff)<<16;
  235. /* 0x0068 123 */ and %i2,%o5,%i4
  236. /* 0x006c */ sllx %i4,16,%o1
  237. /* 0x0070 117 */ cmp %g2,6
  238. /* 0x0074 */ bl,pn %icc,.L77000134
  239. /* 0x0078 */ or %g0,3,%i0
  240. /* 0x007c 119 */ ldd [%o4+16],%f0
  241. /* 0x0080 120 */ and %i3,%g3,%o3
  242. ! 124 ! t+=(b>>16)+(t1>>32);
  243. /* 0x0084 124 */ srax %i2,16,%i5
  244. /* 0x0088 117 */ add %o3,%o1,%i4
  245. /* 0x008c 121 */ srax %i3,32,%i3
  246. /* 0x0090 119 */ fdtox %f0,%f0
  247. /* 0x0094 */ std %f0,[%sp+2231]
  248. ! 125 ! i32[i]=t1&0xffffffff;
  249. /* 0x0098 125 */ and %i4,%g3,%l0
  250. /* 0x009c 117 */ or %g0,72,%o3
  251. /* 0x00a0 122 */ ldd [%g4+24],%f0
  252. /* 0x00a4 117 */ or %g0,64,%o4
  253. /* 0x00a8 */ or %g0,4,%o1
  254. ! 126 ! t1=t;
  255. ! 127 ! a=c;
  256. ! 128 ! b=d;
  257. /* 0x00ac 128 */ or %g0,5,%i0
  258. /* 0x00b0 */ or %g0,4,%i1
  259. /* 0x00b4 119 */ ldx [%sp+2231],%g2
  260. /* 0x00b8 122 */ fdtox %f0,%f0
  261. /* 0x00bc 128 */ or %g0,4,%o0
  262. /* 0x00c0 122 */ std %f0,[%sp+2223]
  263. /* 0x00c4 */ ldd [%g4+40],%f2
  264. /* 0x00c8 120 */ and %g2,%g3,%i2
  265. /* 0x00cc 119 */ ldd [%g4+32],%f0
  266. /* 0x00d0 121 */ srax %g2,32,%g2
  267. /* 0x00d4 122 */ ldd [%g4+56],%f4
  268. /* 0x00d8 */ fdtox %f2,%f2
  269. /* 0x00dc */ ldx [%sp+2223],%g5
  270. /* 0x00e0 119 */ fdtox %f0,%f0
  271. /* 0x00e4 125 */ st %l0,[%g1]
  272. /* 0x00e8 124 */ srax %i4,32,%l0
  273. /* 0x00ec 122 */ fdtox %f4,%f4
  274. /* 0x00f0 */ std %f2,[%sp+2223]
  275. /* 0x00f4 123 */ and %g5,%o5,%i4
  276. /* 0x00f8 124 */ add %i5,%l0,%i5
  277. /* 0x00fc 119 */ std %f0,[%sp+2231]
  278. /* 0x0100 123 */ sllx %i4,16,%i4
  279. /* 0x0104 124 */ add %i3,%i5,%i3
  280. /* 0x0108 119 */ ldd [%g4+48],%f2
  281. /* 0x010c 124 */ srax %g5,16,%g5
  282. /* 0x0110 117 */ add %i2,%i4,%i2
  283. /* 0x0114 122 */ ldd [%g4+72],%f0
  284. /* 0x0118 117 */ add %i2,%i3,%i4
  285. /* 0x011c 124 */ srax %i4,32,%i5
  286. /* 0x0120 119 */ fdtox %f2,%f2
  287. /* 0x0124 125 */ and %i4,%g3,%i4
  288. /* 0x0128 122 */ ldx [%sp+2223],%i2
  289. /* 0x012c 124 */ add %g5,%i5,%g5
  290. /* 0x0130 119 */ ldx [%sp+2231],%i3
  291. /* 0x0134 124 */ add %g2,%g5,%g5
  292. /* 0x0138 119 */ std %f2,[%sp+2231]
  293. /* 0x013c 122 */ std %f4,[%sp+2223]
  294. /* 0x0140 119 */ ldd [%g4+64],%f2
  295. /* 0x0144 125 */ st %i4,[%g1+4]
  296. .L900000108:
  297. /* 0x0148 122 */ ldx [%sp+2223],%i4
  298. /* 0x014c 128 */ add %o0,2,%o0
  299. /* 0x0150 */ add %i0,4,%i0
  300. /* 0x0154 119 */ ldx [%sp+2231],%l0
  301. /* 0x0158 117 */ add %o3,16,%o3
  302. /* 0x015c 123 */ and %i2,%o5,%g2
  303. /* 0x0160 */ sllx %g2,16,%i5
  304. /* 0x0164 120 */ and %i3,%g3,%g2
  305. /* 0x0168 122 */ ldd [%g4+%o3],%f4
  306. /* 0x016c */ fdtox %f0,%f0
  307. /* 0x0170 */ std %f0,[%sp+2223]
  308. /* 0x0174 124 */ srax %i2,16,%i2
  309. /* 0x0178 117 */ add %g2,%i5,%g2
  310. /* 0x017c 119 */ fdtox %f2,%f0
  311. /* 0x0180 117 */ add %o4,16,%o4
  312. /* 0x0184 119 */ std %f0,[%sp+2231]
  313. /* 0x0188 117 */ add %g2,%g5,%g2
  314. /* 0x018c 119 */ ldd [%g4+%o4],%f2
  315. /* 0x0190 124 */ srax %g2,32,%i5
  316. /* 0x0194 128 */ cmp %o0,%o2
  317. /* 0x0198 121 */ srax %i3,32,%g5
  318. /* 0x019c 124 */ add %i2,%i5,%i2
  319. /* 0x01a0 */ add %g5,%i2,%i5
  320. /* 0x01a4 117 */ add %o1,4,%o1
  321. /* 0x01a8 125 */ and %g2,%g3,%g2
  322. /* 0x01ac 127 */ or %g0,%l0,%g5
  323. /* 0x01b0 125 */ st %g2,[%g1+%o1]
  324. /* 0x01b4 128 */ add %i1,4,%i1
  325. /* 0x01b8 122 */ ldx [%sp+2223],%i2
  326. /* 0x01bc 119 */ ldx [%sp+2231],%i3
  327. /* 0x01c0 117 */ add %o3,16,%o3
  328. /* 0x01c4 123 */ and %i4,%o5,%g2
  329. /* 0x01c8 */ sllx %g2,16,%l0
  330. /* 0x01cc 120 */ and %g5,%g3,%g2
  331. /* 0x01d0 122 */ ldd [%g4+%o3],%f0
  332. /* 0x01d4 */ fdtox %f4,%f4
  333. /* 0x01d8 */ std %f4,[%sp+2223]
  334. /* 0x01dc 124 */ srax %i4,16,%i4
  335. /* 0x01e0 117 */ add %g2,%l0,%g2
  336. /* 0x01e4 119 */ fdtox %f2,%f2
  337. /* 0x01e8 117 */ add %o4,16,%o4
  338. /* 0x01ec 119 */ std %f2,[%sp+2231]
  339. /* 0x01f0 117 */ add %g2,%i5,%g2
  340. /* 0x01f4 119 */ ldd [%g4+%o4],%f2
  341. /* 0x01f8 124 */ srax %g2,32,%i5
  342. /* 0x01fc 121 */ srax %g5,32,%g5
  343. /* 0x0200 124 */ add %i4,%i5,%i4
  344. /* 0x0204 */ add %g5,%i4,%g5
  345. /* 0x0208 117 */ add %o1,4,%o1
  346. /* 0x020c 125 */ and %g2,%g3,%g2
  347. /* 0x0210 128 */ ble,pt %icc,.L900000108
  348. /* 0x0214 */ st %g2,[%g1+%o1]
  349. .L900000111:
  350. /* 0x0218 122 */ ldx [%sp+2223],%o2
  351. /* 0x021c 123 */ and %i2,%o5,%i4
  352. /* 0x0220 120 */ and %i3,%g3,%g2
  353. /* 0x0224 123 */ sllx %i4,16,%i4
  354. /* 0x0228 119 */ ldx [%sp+2231],%i5
  355. /* 0x022c 128 */ cmp %o0,%o7
  356. /* 0x0230 124 */ srax %i2,16,%i2
  357. /* 0x0234 117 */ add %g2,%i4,%g2
  358. /* 0x0238 122 */ fdtox %f0,%f4
  359. /* 0x023c */ std %f4,[%sp+2223]
  360. /* 0x0240 117 */ add %g2,%g5,%g5
  361. /* 0x0244 123 */ and %o2,%o5,%l0
  362. /* 0x0248 124 */ srax %g5,32,%l1
  363. /* 0x024c 120 */ and %i5,%g3,%i4
  364. /* 0x0250 119 */ fdtox %f2,%f0
  365. /* 0x0254 121 */ srax %i3,32,%g2
  366. /* 0x0258 119 */ std %f0,[%sp+2231]
  367. /* 0x025c 124 */ add %i2,%l1,%i2
  368. /* 0x0260 123 */ sllx %l0,16,%i3
  369. /* 0x0264 124 */ add %g2,%i2,%i2
  370. /* 0x0268 */ srax %o2,16,%o2
  371. /* 0x026c 117 */ add %o1,4,%g2
  372. /* 0x0270 */ add %i4,%i3,%o1
  373. /* 0x0274 125 */ and %g5,%g3,%g5
  374. /* 0x0278 */ st %g5,[%g1+%g2]
  375. /* 0x027c 119 */ ldx [%sp+2231],%i3
  376. /* 0x0280 117 */ add %o1,%i2,%o1
  377. /* 0x0284 */ add %g2,4,%g2
  378. /* 0x0288 124 */ srax %o1,32,%i4
  379. /* 0x028c 122 */ ldx [%sp+2223],%i2
  380. /* 0x0290 125 */ and %o1,%g3,%g5
  381. /* 0x0294 121 */ srax %i5,32,%o1
  382. /* 0x0298 124 */ add %o2,%i4,%o2
  383. /* 0x029c 125 */ st %g5,[%g1+%g2]
  384. /* 0x02a0 128 */ bg,pn %icc,.L77000127
  385. /* 0x02a4 */ add %o1,%o2,%g5
  386. /* 0x02a8 */ add %i0,6,%i0
  387. /* 0x02ac */ add %i1,6,%i1
  388. .L77000134:
  389. /* 0x02b0 119 */ sra %i1,0,%o2
  390. .L900000112:
  391. /* 0x02b4 119 */ sllx %o2,3,%o3
  392. /* 0x02b8 120 */ and %i3,%g3,%o1
  393. /* 0x02bc 119 */ ldd [%g4+%o3],%f0
  394. /* 0x02c0 122 */ sra %i0,0,%o3
  395. /* 0x02c4 123 */ and %i2,%o5,%o2
  396. /* 0x02c8 122 */ sllx %o3,3,%o3
  397. /* 0x02cc 120 */ add %g5,%o1,%o1
  398. /* 0x02d0 119 */ fdtox %f0,%f0
  399. /* 0x02d4 */ std %f0,[%sp+2231]
  400. /* 0x02d8 123 */ sllx %o2,16,%o2
  401. /* 0x02dc */ add %o1,%o2,%o2
  402. /* 0x02e0 128 */ add %i1,2,%i1
  403. /* 0x02e4 122 */ ldd [%g4+%o3],%f0
  404. /* 0x02e8 124 */ srax %o2,32,%g2
  405. /* 0x02ec 125 */ and %o2,%g3,%o3
  406. /* 0x02f0 124 */ srax %i2,16,%o1
  407. /* 0x02f4 128 */ add %i0,2,%i0
  408. /* 0x02f8 122 */ fdtox %f0,%f0
  409. /* 0x02fc */ std %f0,[%sp+2223]
  410. /* 0x0300 125 */ sra %o0,0,%o2
  411. /* 0x0304 */ sllx %o2,2,%o2
  412. /* 0x0308 124 */ add %o1,%g2,%g5
  413. /* 0x030c 121 */ srax %i3,32,%g2
  414. /* 0x0310 128 */ add %o0,1,%o0
  415. /* 0x0314 124 */ add %g2,%g5,%g5
  416. /* 0x0318 128 */ cmp %o0,%o7
  417. /* 0x031c 119 */ ldx [%sp+2231],%o4
  418. /* 0x0320 122 */ ldx [%sp+2223],%i2
  419. /* 0x0324 125 */ st %o3,[%g1+%o2]
  420. /* 0x0328 127 */ or %g0,%o4,%i3
  421. /* 0x032c 128 */ ble,pt %icc,.L900000112
  422. /* 0x0330 */ sra %i1,0,%o2
  423. .L77000127:
  424. ! 129 ! }
  425. ! 130 ! t1+=a&0xffffffff;
  426. ! 131 ! t=(a>>32);
  427. ! 132 ! t1+=(b&0xffff)<<16;
  428. ! 133 ! i32[i]=t1&0xffffffff;
  429. /* 0x0334 133 */ sethi %hi(0xfc00),%g2
  430. .L900000113:
  431. /* 0x0338 133 */ or %g0,-1,%g3
  432. /* 0x033c */ add %g2,1023,%g2
  433. /* 0x0340 */ srl %g3,0,%g3
  434. /* 0x0344 */ and %i2,%g2,%g2
  435. /* 0x0348 */ and %i3,%g3,%g4
  436. /* 0x034c */ sllx %g2,16,%g2
  437. /* 0x0350 */ add %g5,%g4,%g4
  438. /* 0x0354 */ sra %o0,0,%g5
  439. /* 0x0358 */ add %g4,%g2,%g4
  440. /* 0x035c */ sllx %g5,2,%g2
  441. /* 0x0360 */ and %g4,%g3,%g3
  442. /* 0x0364 */ st %g3,[%g1+%g2]
  443. /* 0x0368 */ ret ! Result =
  444. /* 0x036c */ restore %g0,%g0,%g0
  445. /* 0x0370 0 */ .type conv_d16_to_i32,2
  446. /* 0x0370 */ .size conv_d16_to_i32,(.-conv_d16_to_i32)
  447. .section ".text",#alloc,#execinstr
  448. /* 000000 0 */ .align 8
  449. !
  450. ! CONSTANT POOL
  451. !
  452. .L_const_seg_900000201:
  453. /* 000000 0 */ .word 1127219200,0
  454. /* 0x0008 0 */ .align 8
  455. /* 0x0008 */ .skip 24
  456. !
  457. ! SUBROUTINE conv_i32_to_d32
  458. !
  459. ! OFFSET SOURCE LINE LABEL INSTRUCTION
  460. .global conv_i32_to_d32
  461. conv_i32_to_d32:
  462. /* 000000 */ or %g0,%o7,%g3
  463. ! 135 !}
  464. ! 137 !void conv_i32_to_d32(double *d32, unsigned int *i32, int len)
  465. ! 138 !{
  466. ! 139 !int i;
  467. ! 141 !#pragma pipeloop(0)
  468. ! 142 ! for(i=0;i<len;i++) d32[i]=(double)(i32[i]);
  469. /* 0x0004 142 */ cmp %o2,0
  470. .L900000210:
  471. /* 0x0008 */ call .+8
  472. /* 0x000c */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
  473. /* 0x0010 142 */ or %g0,0,%o3
  474. /* 0x0014 138 */ add %g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
  475. /* 0x0018 142 */ sub %o2,1,%o4
  476. /* 0x001c 138 */ add %g4,%o7,%g1
  477. /* 0x0020 142 */ ble,pt %icc,.L77000140
  478. /* 0x0024 */ or %g0,%g3,%o7
  479. /* 0x0028 */ sethi %hi(.L_const_seg_900000201),%g3
  480. /* 0x002c */ cmp %o2,12
  481. /* 0x0030 */ add %g3,%lo(.L_const_seg_900000201),%g2
  482. /* 0x0034 */ or %g0,%o1,%g5
  483. /* 0x0038 */ ldx [%g1+%g2],%g4
  484. /* 0x003c */ or %g0,0,%g1
  485. /* 0x0040 */ or %g0,24,%g2
  486. /* 0x0044 */ bl,pn %icc,.L77000144
  487. /* 0x0048 */ or %g0,0,%g3
  488. /* 0x004c */ ld [%o1],%f13
  489. /* 0x0050 */ or %g0,7,%o3
  490. /* 0x0054 */ ldd [%g4],%f8
  491. /* 0x0058 */ sub %o2,5,%g3
  492. /* 0x005c */ or %g0,8,%g1
  493. /* 0x0060 */ ld [%o1+4],%f11
  494. /* 0x0064 */ ld [%o1+8],%f7
  495. /* 0x0068 */ fmovs %f8,%f12
  496. /* 0x006c */ ld [%o1+12],%f5
  497. /* 0x0070 */ fmovs %f8,%f10
  498. /* 0x0074 */ ld [%o1+16],%f3
  499. /* 0x0078 */ fmovs %f8,%f6
  500. /* 0x007c */ ld [%o1+20],%f1
  501. /* 0x0080 */ fsubd %f12,%f8,%f12
  502. /* 0x0084 */ std %f12,[%o0]
  503. /* 0x0088 */ fsubd %f10,%f8,%f10
  504. /* 0x008c */ std %f10,[%o0+8]
  505. .L900000205:
  506. /* 0x0090 */ ld [%o1+%g2],%f11
  507. /* 0x0094 */ add %g1,8,%g1
  508. /* 0x0098 */ add %o3,5,%o3
  509. /* 0x009c */ fsubd %f6,%f8,%f6
  510. /* 0x00a0 */ add %g2,4,%g2
  511. /* 0x00a4 */ std %f6,[%o0+%g1]
  512. /* 0x00a8 */ cmp %o3,%g3
  513. /* 0x00ac */ fmovs %f8,%f4
  514. /* 0x00b0 */ ld [%o1+%g2],%f7
  515. /* 0x00b4 */ fsubd %f4,%f8,%f12
  516. /* 0x00b8 */ add %g1,8,%g1
  517. /* 0x00bc */ add %g2,4,%g2
  518. /* 0x00c0 */ fmovs %f8,%f2
  519. /* 0x00c4 */ std %f12,[%o0+%g1]
  520. /* 0x00c8 */ ld [%o1+%g2],%f5
  521. /* 0x00cc */ fsubd %f2,%f8,%f12
  522. /* 0x00d0 */ add %g1,8,%g1
  523. /* 0x00d4 */ add %g2,4,%g2
  524. /* 0x00d8 */ fmovs %f8,%f0
  525. /* 0x00dc */ std %f12,[%o0+%g1]
  526. /* 0x00e0 */ ld [%o1+%g2],%f3
  527. /* 0x00e4 */ fsubd %f0,%f8,%f12
  528. /* 0x00e8 */ add %g1,8,%g1
  529. /* 0x00ec */ add %g2,4,%g2
  530. /* 0x00f0 */ fmovs %f8,%f10
  531. /* 0x00f4 */ std %f12,[%o0+%g1]
  532. /* 0x00f8 */ ld [%o1+%g2],%f1
  533. /* 0x00fc */ fsubd %f10,%f8,%f10
  534. /* 0x0100 */ add %g1,8,%g1
  535. /* 0x0104 */ add %g2,4,%g2
  536. /* 0x0108 */ std %f10,[%o0+%g1]
  537. /* 0x010c */ ble,pt %icc,.L900000205
  538. /* 0x0110 */ fmovs %f8,%f6
  539. .L900000208:
  540. /* 0x0114 */ fmovs %f8,%f4
  541. /* 0x0118 */ ld [%o1+%g2],%f11
  542. /* 0x011c */ add %g1,8,%g3
  543. /* 0x0120 */ fmovs %f8,%f2
  544. /* 0x0124 */ add %g1,16,%g1
  545. /* 0x0128 */ cmp %o3,%o4
  546. /* 0x012c */ fmovs %f8,%f0
  547. /* 0x0130 */ add %g1,8,%o1
  548. /* 0x0134 */ add %g1,16,%o2
  549. /* 0x0138 */ fmovs %f8,%f10
  550. /* 0x013c */ add %g1,24,%g2
  551. /* 0x0140 */ fsubd %f6,%f8,%f6
  552. /* 0x0144 */ std %f6,[%o0+%g3]
  553. /* 0x0148 */ fsubd %f4,%f8,%f4
  554. /* 0x014c */ std %f4,[%o0+%g1]
  555. /* 0x0150 */ sra %o3,0,%g1
  556. /* 0x0154 */ fsubd %f2,%f8,%f2
  557. /* 0x0158 */ std %f2,[%o0+%o1]
  558. /* 0x015c */ sllx %g1,2,%g3
  559. /* 0x0160 */ fsubd %f0,%f8,%f0
  560. /* 0x0164 */ std %f0,[%o0+%o2]
  561. /* 0x0168 */ fsubd %f10,%f8,%f0
  562. /* 0x016c */ bg,pn %icc,.L77000140
  563. /* 0x0170 */ std %f0,[%o0+%g2]
  564. .L77000144:
  565. /* 0x0174 */ ldd [%g4],%f8
  566. .L900000211:
  567. /* 0x0178 */ ld [%g5+%g3],%f13
  568. /* 0x017c */ sllx %g1,3,%g2
  569. /* 0x0180 */ add %o3,1,%o3
  570. /* 0x0184 */ sra %o3,0,%g1
  571. /* 0x0188 */ cmp %o3,%o4
  572. /* 0x018c */ fmovs %f8,%f12
  573. /* 0x0190 */ sllx %g1,2,%g3
  574. /* 0x0194 */ fsubd %f12,%f8,%f0
  575. /* 0x0198 */ std %f0,[%o0+%g2]
  576. /* 0x019c */ ble,a,pt %icc,.L900000211
  577. /* 0x01a0 */ ldd [%g4],%f8
  578. .L77000140:
  579. /* 0x01a4 */ retl ! Result =
  580. /* 0x01a8 */ nop
  581. /* 0x01ac 0 */ .type conv_i32_to_d32,2
  582. /* 0x01ac */ .size conv_i32_to_d32,(.-conv_i32_to_d32)
  583. .section ".text",#alloc,#execinstr
  584. /* 000000 0 */ .align 8
  585. !
  586. ! CONSTANT POOL
  587. !
  588. .L_const_seg_900000301:
  589. /* 000000 0 */ .word 1127219200,0
  590. /* 0x0008 0 */ .align 8
  591. /* 0x0008 */ .skip 24
  592. !
  593. ! SUBROUTINE conv_i32_to_d16
  594. !
  595. ! OFFSET SOURCE LINE LABEL INSTRUCTION
  596. .global conv_i32_to_d16
  597. conv_i32_to_d16:
  598. /* 000000 */ save %sp,-192,%sp
  599. .L900000310:
  600. /* 0x0004 */ call .+8
  601. /* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
  602. ! 143 !}
  603. ! 146 !void conv_i32_to_d16(double *d16, unsigned int *i32, int len)
  604. ! 147 !{
  605. ! 148 !int i;
  606. ! 149 !unsigned int a;
  607. ! 151 !#pragma pipeloop(0)
  608. ! 152 ! for(i=0;i<len;i++)
  609. /* 0x000c 152 */ cmp %i2,0
  610. /* 0x0010 147 */ add %g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
  611. /* 0x0014 152 */ ble,pt %icc,.L77000150
  612. /* 0x0018 */ add %g3,%o7,%o0
  613. ! 153 ! {
  614. ! 154 ! a=i32[i];
  615. ! 155 ! d16[2*i]=(double)(a&0xffff);
  616. ! 156 ! d16[2*i+1]=(double)(a>>16);
  617. /* 0x001c 156 */ sethi %hi(.L_const_seg_900000301),%g2
  618. /* 0x0020 147 */ or %g0,%i2,%o1
  619. /* 0x0024 152 */ sethi %hi(0xfc00),%g3
  620. /* 0x0028 156 */ add %g2,%lo(.L_const_seg_900000301),%g2
  621. /* 0x002c 152 */ or %g0,%o1,%g4
  622. /* 0x0030 156 */ ldx [%o0+%g2],%o5
  623. /* 0x0034 152 */ add %g3,1023,%g1
  624. /* 0x0038 147 */ or %g0,%i1,%o7
  625. /* 0x003c 152 */ or %g0,0,%i2
  626. /* 0x0040 */ sub %o1,1,%g5
  627. /* 0x0044 */ or %g0,0,%g3
  628. /* 0x0048 */ or %g0,1,%g2
  629. /* 0x004c 154 */ or %g0,0,%o2
  630. /* 0x0050 */ cmp %g4,6
  631. /* 0x0054 152 */ bl,pn %icc,.L77000154
  632. /* 0x0058 */ ldd [%o5],%f0
  633. /* 0x005c */ sub %o1,2,%o3
  634. /* 0x0060 */ or %g0,16,%o2
  635. /* 0x0064 154 */ ld [%i1],%o4
  636. /* 0x0068 156 */ or %g0,3,%g2
  637. /* 0x006c */ or %g0,2,%g3
  638. /* 0x0070 155 */ fmovs %f0,%f2
  639. /* 0x0074 156 */ or %g0,4,%i2
  640. /* 0x0078 155 */ and %o4,%g1,%o0
  641. /* 0x007c */ st %o0,[%sp+2227]
  642. /* 0x0080 */ fmovs %f0,%f4
  643. /* 0x0084 156 */ srl %o4,16,%i4
  644. /* 0x0088 152 */ or %g0,12,%o4
  645. /* 0x008c */ or %g0,24,%o0
  646. /* 0x0090 155 */ ld [%sp+2227],%f3
  647. /* 0x0094 */ fsubd %f2,%f0,%f2
  648. /* 0x0098 */ std %f2,[%i0]
  649. /* 0x009c 156 */ st %i4,[%sp+2223]
  650. /* 0x00a0 154 */ ld [%o7+4],%o1
  651. /* 0x00a4 156 */ fmovs %f0,%f2
  652. /* 0x00a8 155 */ and %o1,%g1,%i1
  653. /* 0x00ac 156 */ ld [%sp+2223],%f3
  654. /* 0x00b0 */ srl %o1,16,%o1
  655. /* 0x00b4 */ fsubd %f2,%f0,%f2
  656. /* 0x00b8 */ std %f2,[%i0+8]
  657. /* 0x00bc */ st %o1,[%sp+2223]
  658. /* 0x00c0 155 */ st %i1,[%sp+2227]
  659. /* 0x00c4 154 */ ld [%o7+8],%o1
  660. /* 0x00c8 156 */ fmovs %f0,%f2
  661. /* 0x00cc 155 */ and %o1,%g1,%g4
  662. /* 0x00d0 */ ld [%sp+2227],%f5
  663. /* 0x00d4 156 */ srl %o1,16,%o1
  664. /* 0x00d8 */ ld [%sp+2223],%f3
  665. /* 0x00dc */ st %o1,[%sp+2223]
  666. /* 0x00e0 155 */ fsubd %f4,%f0,%f4
  667. /* 0x00e4 */ st %g4,[%sp+2227]
  668. /* 0x00e8 156 */ fsubd %f2,%f0,%f2
  669. /* 0x00ec 154 */ ld [%o7+12],%o1
  670. /* 0x00f0 155 */ std %f4,[%i0+16]
  671. /* 0x00f4 156 */ std %f2,[%i0+24]
  672. .L900000306:
  673. /* 0x00f8 155 */ ld [%sp+2227],%f5
  674. /* 0x00fc 156 */ add %i2,2,%i2
  675. /* 0x0100 */ add %g2,4,%g2
  676. /* 0x0104 */ ld [%sp+2223],%f3
  677. /* 0x0108 */ cmp %i2,%o3
  678. /* 0x010c */ add %g3,4,%g3
  679. /* 0x0110 155 */ and %o1,%g1,%g4
  680. /* 0x0114 156 */ srl %o1,16,%o1
  681. /* 0x0118 155 */ st %g4,[%sp+2227]
  682. /* 0x011c 156 */ st %o1,[%sp+2223]
  683. /* 0x0120 152 */ add %o4,4,%o1
  684. /* 0x0124 154 */ ld [%o7+%o1],%o4
  685. /* 0x0128 156 */ fmovs %f0,%f2
  686. /* 0x012c 155 */ fmovs %f0,%f4
  687. /* 0x0130 */ fsubd %f4,%f0,%f4
  688. /* 0x0134 152 */ add %o2,16,%o2
  689. /* 0x0138 156 */ fsubd %f2,%f0,%f2
  690. /* 0x013c 155 */ std %f4,[%i0+%o2]
  691. /* 0x0140 152 */ add %o0,16,%o0
  692. /* 0x0144 156 */ std %f2,[%i0+%o0]
  693. /* 0x0148 155 */ ld [%sp+2227],%f5
  694. /* 0x014c 156 */ ld [%sp+2223],%f3
  695. /* 0x0150 155 */ and %o4,%g1,%g4
  696. /* 0x0154 156 */ srl %o4,16,%o4
  697. /* 0x0158 155 */ st %g4,[%sp+2227]
  698. /* 0x015c 156 */ st %o4,[%sp+2223]
  699. /* 0x0160 152 */ add %o1,4,%o4
  700. /* 0x0164 154 */ ld [%o7+%o4],%o1
  701. /* 0x0168 156 */ fmovs %f0,%f2
  702. /* 0x016c 155 */ fmovs %f0,%f4
  703. /* 0x0170 */ fsubd %f4,%f0,%f4
  704. /* 0x0174 152 */ add %o2,16,%o2
  705. /* 0x0178 156 */ fsubd %f2,%f0,%f2
  706. /* 0x017c 155 */ std %f4,[%i0+%o2]
  707. /* 0x0180 152 */ add %o0,16,%o0
  708. /* 0x0184 156 */ ble,pt %icc,.L900000306
  709. /* 0x0188 */ std %f2,[%i0+%o0]
  710. .L900000309:
  711. /* 0x018c 155 */ ld [%sp+2227],%f5
  712. /* 0x0190 156 */ fmovs %f0,%f2
  713. /* 0x0194 */ srl %o1,16,%o3
  714. /* 0x0198 */ ld [%sp+2223],%f3
  715. /* 0x019c 155 */ and %o1,%g1,%i1
  716. /* 0x01a0 152 */ add %o2,16,%g4
  717. /* 0x01a4 155 */ fmovs %f0,%f4
  718. /* 0x01a8 */ st %i1,[%sp+2227]
  719. /* 0x01ac 152 */ add %o0,16,%o2
  720. /* 0x01b0 156 */ st %o3,[%sp+2223]
  721. /* 0x01b4 154 */ sra %i2,0,%o3
  722. /* 0x01b8 152 */ add %g4,16,%o1
  723. /* 0x01bc 155 */ fsubd %f4,%f0,%f4
  724. /* 0x01c0 */ std %f4,[%i0+%g4]
  725. /* 0x01c4 152 */ add %o0,32,%o0
  726. /* 0x01c8 156 */ fsubd %f2,%f0,%f2
  727. /* 0x01cc */ std %f2,[%i0+%o2]
  728. /* 0x01d0 */ sllx %o3,2,%o2
  729. /* 0x01d4 155 */ ld [%sp+2227],%f5
  730. /* 0x01d8 156 */ cmp %i2,%g5
  731. /* 0x01dc */ add %g2,6,%g2
  732. /* 0x01e0 */ ld [%sp+2223],%f3
  733. /* 0x01e4 */ add %g3,6,%g3
  734. /* 0x01e8 155 */ fmovs %f0,%f4
  735. /* 0x01ec 156 */ fmovs %f0,%f2
  736. /* 0x01f0 155 */ fsubd %f4,%f0,%f4
  737. /* 0x01f4 */ std %f4,[%i0+%o1]
  738. /* 0x01f8 156 */ fsubd %f2,%f0,%f0
  739. /* 0x01fc */ bg,pn %icc,.L77000150
  740. /* 0x0200 */ std %f0,[%i0+%o0]
  741. .L77000154:
  742. /* 0x0204 155 */ ldd [%o5],%f0
  743. .L900000311:
  744. /* 0x0208 154 */ ld [%o7+%o2],%o0
  745. /* 0x020c 155 */ sra %g3,0,%o1
  746. /* 0x0210 */ fmovs %f0,%f2
  747. /* 0x0214 */ sllx %o1,3,%o2
  748. /* 0x0218 156 */ add %i2,1,%i2
  749. /* 0x021c 155 */ and %o0,%g1,%o1
  750. /* 0x0220 */ st %o1,[%sp+2227]
  751. /* 0x0224 156 */ add %g3,2,%g3
  752. /* 0x0228 */ srl %o0,16,%o1
  753. /* 0x022c */ cmp %i2,%g5
  754. /* 0x0230 */ sra %g2,0,%o0
  755. /* 0x0234 */ add %g2,2,%g2
  756. /* 0x0238 */ sllx %o0,3,%o0
  757. /* 0x023c 155 */ ld [%sp+2227],%f3
  758. /* 0x0240 154 */ sra %i2,0,%o3
  759. /* 0x0244 155 */ fsubd %f2,%f0,%f2
  760. /* 0x0248 */ std %f2,[%i0+%o2]
  761. /* 0x024c */ sllx %o3,2,%o2
  762. /* 0x0250 156 */ st %o1,[%sp+2223]
  763. /* 0x0254 */ fmovs %f0,%f2
  764. /* 0x0258 */ ld [%sp+2223],%f3
  765. /* 0x025c */ fsubd %f2,%f0,%f0
  766. /* 0x0260 */ std %f0,[%i0+%o0]
  767. /* 0x0264 */ ble,a,pt %icc,.L900000311
  768. /* 0x0268 */ ldd [%o5],%f0
  769. .L77000150:
  770. /* 0x026c */ ret ! Result =
  771. /* 0x0270 */ restore %g0,%g0,%g0
  772. /* 0x0274 0 */ .type conv_i32_to_d16,2
  773. /* 0x0274 */ .size conv_i32_to_d16,(.-conv_i32_to_d16)
  774. .section ".text",#alloc,#execinstr
  775. /* 000000 0 */ .align 8
  776. !
  777. ! CONSTANT POOL
  778. !
  779. .L_const_seg_900000401:
  780. /* 000000 0 */ .word 1127219200,0
  781. /* 0x0008 0 */ .align 8
  782. /* 0x0008 */ .skip 24
  783. !
  784. ! SUBROUTINE conv_i32_to_d32_and_d16
  785. !
  786. ! OFFSET SOURCE LINE LABEL INSTRUCTION
  787. .global conv_i32_to_d32_and_d16
  788. conv_i32_to_d32_and_d16:
  789. /* 000000 */ save %sp,-192,%sp
  790. .L900000415:
  791. /* 0x0004 */ call .+8
  792. /* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g3
  793. ! 157 ! }
  794. ! 158 !}
  795. ! 161 !void conv_i32_to_d32_and_d16(double *d32, double *d16,
  796. ! 162 ! unsigned int *i32, int len)
  797. ! 163 !{
  798. ! 164 !int i = 0;
  799. ! 165 !unsigned int a;
  800. ! 167 !#pragma pipeloop(0)
  801. ! 168 !#ifdef RF_INLINE_MACROS
  802. ! 169 ! for(;i<len-3;i+=4)
  803. ! 170 ! {
  804. ! 171 ! i16_to_d16_and_d32x4(&TwoToMinus16, &TwoTo16, &Zero,
  805. ! 172 ! &(d16[2*i]), &(d32[i]), (float *)(&(i32[i])));
  806. /* 0x000c 172 */ sethi %hi(Zero),%g2
  807. /* 0x0010 163 */ add %g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g3
  808. /* 0x0014 */ or %g0,%i3,%g5
  809. /* 0x0018 */ add %g3,%o7,%o3
  810. /* 0x001c 172 */ add %g2,%lo(Zero),%g2
  811. /* 0x0020 */ ldx [%o3+%g2],%o0
  812. /* 0x0024 */ sethi %hi(TwoToMinus16),%g3
  813. /* 0x0028 163 */ or %g0,%i0,%i3
  814. /* 0x002c 169 */ sub %g5,3,%o1
  815. /* 0x0030 172 */ sethi %hi(TwoTo16),%g4
  816. /* 0x0034 163 */ or %g0,%i2,%i0
  817. /* 0x0038 172 */ add %g3,%lo(TwoToMinus16),%g2
  818. /* 0x003c */ ldx [%o3+%g2],%o2
  819. /* 0x0040 169 */ cmp %o1,0
  820. /* 0x0044 164 */ or %g0,0,%i2
  821. /* 0x0048 169 */ ble,pt %icc,.L900000418
  822. /* 0x004c */ cmp %i2,%g5
  823. /* 0x0050 */ ldd [%o0],%f2
  824. /* 0x0054 172 */ add %g4,%lo(TwoTo16),%g3
  825. /* 0x0058 */ ldx [%o3+%g3],%o1
  826. /* 0x005c 169 */ sub %g5,4,%o4
  827. /* 0x0060 */ or %g0,0,%o5
  828. .L900000417:
  829. /* 0x0064 172 */ sra %i2,0,%g2
  830. /* 0x0068 */ fmovd %f2,%f14
  831. /* 0x006c */ ldd [%o2],%f0
  832. /* 0x0070 */ sllx %g2,2,%g3
  833. /* 0x0074 */ fmovd %f2,%f10
  834. /* 0x0078 */ ldd [%o1],%f16
  835. /* 0x007c */ ld [%g3+%i0],%f15
  836. /* 0x0080 */ add %i0,%g3,%g3
  837. /* 0x0084 */ fmovd %f2,%f6
  838. /* 0x0088 */ ld [%g3+4],%f11
  839. /* 0x008c */ sra %o5,0,%g4
  840. /* 0x0090 */ add %i2,4,%i2
  841. /* 0x0094 */ ld [%g3+8],%f7
  842. /* 0x0098 */ fxtod %f14,%f14
  843. /* 0x009c */ sllx %g2,3,%g2
  844. /* 0x00a0 */ ld [%g3+12],%f3
  845. /* 0x00a4 */ fxtod %f10,%f10
  846. /* 0x00a8 */ sllx %g4,3,%g3
  847. /* 0x00ac */ fxtod %f6,%f6
  848. /* 0x00b0 */ std %f14,[%g2+%i3]
  849. /* 0x00b4 */ add %i3,%g2,%g4
  850. /* 0x00b8 */ fxtod %f2,%f2
  851. /* 0x00bc */ fmuld %f0,%f14,%f12
  852. /* 0x00c0 */ std %f2,[%g4+24]
  853. /* 0x00c4 */ fmuld %f0,%f10,%f8
  854. /* 0x00c8 */ std %f10,[%g4+8]
  855. /* 0x00cc */ add %i1,%g3,%g2
  856. /* 0x00d0 */ fmuld %f0,%f6,%f4
  857. /* 0x00d4 */ std %f6,[%g4+16]
  858. /* 0x00d8 */ cmp %i2,%o4
  859. /* 0x00dc */ fmuld %f0,%f2,%f0
  860. /* 0x00e0 */ fdtox %f12,%f12
  861. /* 0x00e4 */ add %o5,8,%o5
  862. /* 0x00e8 */ fdtox %f8,%f8
  863. /* 0x00ec */ fdtox %f4,%f4
  864. /* 0x00f0 */ fdtox %f0,%f0
  865. /* 0x00f4 */ fxtod %f12,%f12
  866. /* 0x00f8 */ std %f12,[%g2+8]
  867. /* 0x00fc */ fxtod %f8,%f8
  868. /* 0x0100 */ std %f8,[%g2+24]
  869. /* 0x0104 */ fxtod %f4,%f4
  870. /* 0x0108 */ std %f4,[%g2+40]
  871. /* 0x010c */ fxtod %f0,%f0
  872. /* 0x0110 */ std %f0,[%g2+56]
  873. /* 0x0114 */ fmuld %f12,%f16,%f12
  874. /* 0x0118 */ fmuld %f8,%f16,%f8
  875. /* 0x011c */ fmuld %f4,%f16,%f4
  876. /* 0x0120 */ fsubd %f14,%f12,%f12
  877. /* 0x0124 */ std %f12,[%g3+%i1]
  878. /* 0x0128 */ fmuld %f0,%f16,%f0
  879. /* 0x012c */ fsubd %f10,%f8,%f8
  880. /* 0x0130 */ std %f8,[%g2+16]
  881. /* 0x0134 */ fsubd %f6,%f4,%f4
  882. /* 0x0138 */ std %f4,[%g2+32]
  883. /* 0x013c */ fsubd %f2,%f0,%f0
  884. /* 0x0140 */ std %f0,[%g2+48]
  885. /* 0x0144 */ ble,a,pt %icc,.L900000417
  886. /* 0x0148 */ ldd [%o0],%f2
  887. .L77000159:
  888. ! 173 ! }
  889. ! 174 !#endif
  890. ! 175 ! for(;i<len;i++)
  891. /* 0x014c 175 */ cmp %i2,%g5
  892. .L900000418:
  893. /* 0x0150 175 */ bge,pt %icc,.L77000164
  894. /* 0x0154 */ nop
  895. ! 176 ! {
  896. ! 177 ! a=i32[i];
  897. ! 178 ! d32[i]=(double)(i32[i]);
  898. ! 179 ! d16[2*i]=(double)(a&0xffff);
  899. ! 180 ! d16[2*i+1]=(double)(a>>16);
  900. /* 0x0158 180 */ sethi %hi(.L_const_seg_900000401),%g2
  901. /* 0x015c */ add %g2,%lo(.L_const_seg_900000401),%g2
  902. /* 0x0160 175 */ sethi %hi(0xfc00),%g3
  903. /* 0x0164 180 */ ldx [%o3+%g2],%g1
  904. /* 0x0168 175 */ sll %i2,1,%i4
  905. /* 0x016c */ sub %g5,%i2,%g4
  906. /* 0x0170 177 */ sra %i2,0,%o3
  907. /* 0x0174 175 */ add %g3,1023,%g3
  908. /* 0x0178 178 */ ldd [%g1],%f2
  909. /* 0x017c */ sllx %o3,2,%o2
  910. /* 0x0180 175 */ add %i4,1,%g2
  911. /* 0x0184 177 */ or %g0,%o3,%o1
  912. /* 0x0188 */ cmp %g4,6
  913. /* 0x018c 175 */ bl,pn %icc,.L77000161
  914. /* 0x0190 */ sra %i2,0,%o3
  915. /* 0x0194 177 */ or %g0,%o2,%o0
  916. /* 0x0198 178 */ ld [%i0+%o2],%f5
  917. /* 0x019c 179 */ fmovs %f2,%f8
  918. /* 0x01a0 175 */ add %o0,4,%o3
  919. /* 0x01a4 177 */ ld [%i0+%o0],%o7
  920. /* 0x01a8 180 */ fmovs %f2,%f6
  921. /* 0x01ac 178 */ fmovs %f2,%f4
  922. /* 0x01b0 */ sllx %o1,3,%o2
  923. /* 0x01b4 175 */ add %o3,4,%o5
  924. /* 0x01b8 179 */ sra %i4,0,%o0
  925. /* 0x01bc 175 */ add %o3,8,%o4
  926. /* 0x01c0 178 */ fsubd %f4,%f2,%f4
  927. /* 0x01c4 */ std %f4,[%i3+%o2]
  928. /* 0x01c8 179 */ sllx %o0,3,%i5
  929. /* 0x01cc */ and %o7,%g3,%o0
  930. /* 0x01d0 */ st %o0,[%sp+2227]
  931. /* 0x01d4 175 */ add %i5,16,%o1
  932. /* 0x01d8 180 */ srl %o7,16,%g4
  933. /* 0x01dc */ add %i2,1,%i2
  934. /* 0x01e0 */ sra %g2,0,%o0
  935. /* 0x01e4 175 */ add %o2,8,%o2
  936. /* 0x01e8 179 */ fmovs %f2,%f4
  937. /* 0x01ec 180 */ sllx %o0,3,%l0
  938. /* 0x01f0 */ add %i4,3,%g2
  939. /* 0x01f4 179 */ ld [%sp+2227],%f5
  940. /* 0x01f8 175 */ add %l0,16,%o0
  941. /* 0x01fc 180 */ add %i4,2,%i4
  942. /* 0x0200 175 */ sub %g5,1,%o7
  943. /* 0x0204 180 */ add %i2,3,%i2
  944. /* 0x0208 179 */ fsubd %f4,%f2,%f4
  945. /* 0x020c */ std %f4,[%i1+%i5]
  946. /* 0x0210 180 */ st %g4,[%sp+2223]
  947. /* 0x0214 177 */ ld [%i0+%o3],%i5
  948. /* 0x0218 180 */ fmovs %f2,%f4
  949. /* 0x021c */ srl %i5,16,%g4
  950. /* 0x0220 179 */ and %i5,%g3,%i5
  951. /* 0x0224 180 */ ld [%sp+2223],%f5
  952. /* 0x0228 */ fsubd %f4,%f2,%f4
  953. /* 0x022c */ std %f4,[%i1+%l0]
  954. /* 0x0230 */ st %g4,[%sp+2223]
  955. /* 0x0234 177 */ ld [%i0+%o5],%g4
  956. /* 0x0238 179 */ st %i5,[%sp+2227]
  957. /* 0x023c 178 */ fmovs %f2,%f4
  958. /* 0x0240 180 */ srl %g4,16,%i5
  959. /* 0x0244 179 */ and %g4,%g3,%g4
  960. /* 0x0248 180 */ ld [%sp+2223],%f7
  961. /* 0x024c */ st %i5,[%sp+2223]
  962. /* 0x0250 178 */ ld [%i0+%o3],%f5
  963. /* 0x0254 180 */ fsubd %f6,%f2,%f6
  964. /* 0x0258 177 */ ld [%i0+%o4],%o3
  965. /* 0x025c 178 */ fsubd %f4,%f2,%f4
  966. /* 0x0260 179 */ ld [%sp+2227],%f9
  967. /* 0x0264 180 */ ld [%sp+2223],%f1
  968. /* 0x0268 179 */ st %g4,[%sp+2227]
  969. /* 0x026c */ fsubd %f8,%f2,%f8
  970. /* 0x0270 */ std %f8,[%i1+%o1]
  971. /* 0x0274 180 */ std %f6,[%i1+%o0]
  972. /* 0x0278 178 */ std %f4,[%i3+%o2]
  973. .L900000411:
  974. /* 0x027c 179 */ ld [%sp+2227],%f13
  975. /* 0x0280 180 */ srl %o3,16,%g4
  976. /* 0x0284 */ add %i2,2,%i2
  977. /* 0x0288 */ st %g4,[%sp+2223]
  978. /* 0x028c */ cmp %i2,%o7
  979. /* 0x0290 */ add %g2,4,%g2
  980. /* 0x0294 178 */ ld [%i0+%o5],%f11
  981. /* 0x0298 180 */ add %i4,4,%i4
  982. /* 0x029c 175 */ add %o4,4,%o5
  983. /* 0x02a0 177 */ ld [%i0+%o5],%g4
  984. /* 0x02a4 179 */ and %o3,%g3,%o3
  985. /* 0x02a8 */ st %o3,[%sp+2227]
  986. /* 0x02ac 180 */ fmovs %f2,%f0
  987. /* 0x02b0 179 */ fmovs %f2,%f12
  988. /* 0x02b4 180 */ fsubd %f0,%f2,%f8
  989. /* 0x02b8 179 */ fsubd %f12,%f2,%f4
  990. /* 0x02bc 175 */ add %o1,16,%o1
  991. /* 0x02c0 180 */ ld [%sp+2223],%f7
  992. /* 0x02c4 178 */ fmovs %f2,%f10
  993. /* 0x02c8 179 */ std %f4,[%i1+%o1]
  994. /* 0x02cc 175 */ add %o0,16,%o0
  995. /* 0x02d0 178 */ fsubd %f10,%f2,%f4
  996. /* 0x02d4 175 */ add %o2,8,%o2
  997. /* 0x02d8 180 */ std %f8,[%i1+%o0]
  998. /* 0x02dc 178 */ std %f4,[%i3+%o2]
  999. /* 0x02e0 179 */ ld [%sp+2227],%f9
  1000. /* 0x02e4 180 */ srl %g4,16,%o3
  1001. /* 0x02e8 */ st %o3,[%sp+2223]
  1002. /* 0x02ec 178 */ ld [%i0+%o4],%f5
  1003. /* 0x02f0 175 */ add %o4,8,%o4
  1004. /* 0x02f4 177 */ ld [%i0+%o4],%o3
  1005. /* 0x02f8 179 */ and %g4,%g3,%g4
  1006. /* 0x02fc */ st %g4,[%sp+2227]
  1007. /* 0x0300 180 */ fmovs %f2,%f6
  1008. /* 0x0304 179 */ fmovs %f2,%f8
  1009. /* 0x0308 180 */ fsubd %f6,%f2,%f6
  1010. /* 0x030c 179 */ fsubd %f8,%f2,%f8
  1011. /* 0x0310 175 */ add %o1,16,%o1
  1012. /* 0x0314 180 */ ld [%sp+2223],%f1
  1013. /* 0x0318 178 */ fmovs %f2,%f4
  1014. /* 0x031c 179 */ std %f8,[%i1+%o1]
  1015. /* 0x0320 175 */ add %o0,16,%o0
  1016. /* 0x0324 178 */ fsubd %f4,%f2,%f4
  1017. /* 0x0328 175 */ add %o2,8,%o2
  1018. /* 0x032c 180 */ std %f6,[%i1+%o0]
  1019. /* 0x0330 */ bl,pt %icc,.L900000411
  1020. /* 0x0334 */ std %f4,[%i3+%o2]
  1021. .L900000414:
  1022. /* 0x0338 180 */ srl %o3,16,%o7
  1023. /* 0x033c */ st %o7,[%sp+2223]
  1024. /* 0x0340 179 */ fmovs %f2,%f12
  1025. /* 0x0344 178 */ ld [%i0+%o5],%f11
  1026. /* 0x0348 180 */ fmovs %f2,%f0
  1027. /* 0x034c 179 */ and %o3,%g3,%g4
  1028. /* 0x0350 180 */ fmovs %f2,%f6
  1029. /* 0x0354 175 */ add %o1,16,%o3
  1030. /* 0x0358 */ add %o0,16,%o7
  1031. /* 0x035c 178 */ fmovs %f2,%f10
  1032. /* 0x0360 175 */ add %o2,8,%o2
  1033. /* 0x0364 */ add %o1,32,%o5
  1034. /* 0x0368 179 */ ld [%sp+2227],%f13
  1035. /* 0x036c 178 */ fmovs %f2,%f4
  1036. /* 0x0370 175 */ add %o0,32,%o1
  1037. /* 0x0374 180 */ ld [%sp+2223],%f7
  1038. /* 0x0378 175 */ add %o2,8,%o0
  1039. /* 0x037c 180 */ cmp %i2,%g5
  1040. /* 0x0380 179 */ st %g4,[%sp+2227]
  1041. /* 0x0384 */ fsubd %f12,%f2,%f8
  1042. /* 0x0388 180 */ add %g2,6,%g2
  1043. /* 0x038c 179 */ std %f8,[%i1+%o3]
  1044. /* 0x0390 180 */ fsubd %f0,%f2,%f0
  1045. /* 0x0394 177 */ sra %i2,0,%o3
  1046. /* 0x0398 180 */ std %f0,[%i1+%o7]
  1047. /* 0x039c 178 */ fsubd %f10,%f2,%f0
  1048. /* 0x03a0 180 */ add %i4,6,%i4
  1049. /* 0x03a4 178 */ std %f0,[%i3+%o2]
  1050. /* 0x03a8 */ sllx %o3,2,%o2
  1051. /* 0x03ac 179 */ ld [%sp+2227],%f9
  1052. /* 0x03b0 178 */ ld [%i0+%o4],%f5
  1053. /* 0x03b4 179 */ fmovs %f2,%f8
  1054. /* 0x03b8 */ fsubd %f8,%f2,%f0
  1055. /* 0x03bc */ std %f0,[%i1+%o5]
  1056. /* 0x03c0 180 */ fsubd %f6,%f2,%f0
  1057. /* 0x03c4 */ std %f0,[%i1+%o1]
  1058. /* 0x03c8 178 */ fsubd %f4,%f2,%f0
  1059. /* 0x03cc 180 */ bge,pn %icc,.L77000164
  1060. /* 0x03d0 */ std %f0,[%i3+%o0]
  1061. .L77000161:
  1062. /* 0x03d4 178 */ ldd [%g1],%f2
  1063. .L900000416:
  1064. /* 0x03d8 178 */ ld [%i0+%o2],%f5
  1065. /* 0x03dc 179 */ sra %i4,0,%o0
  1066. /* 0x03e0 180 */ add %i2,1,%i2
  1067. /* 0x03e4 177 */ ld [%i0+%o2],%o1
  1068. /* 0x03e8 178 */ sllx %o3,3,%o3
  1069. /* 0x03ec 180 */ add %i4,2,%i4
  1070. /* 0x03f0 178 */ fmovs %f2,%f4
  1071. /* 0x03f4 179 */ sllx %o0,3,%o4
  1072. /* 0x03f8 180 */ cmp %i2,%g5
  1073. /* 0x03fc 179 */ and %o1,%g3,%o0
  1074. /* 0x0400 178 */ fsubd %f4,%f2,%f0
  1075. /* 0x0404 */ std %f0,[%i3+%o3]
  1076. /* 0x0408 180 */ srl %o1,16,%o1
  1077. /* 0x040c 179 */ st %o0,[%sp+2227]
  1078. /* 0x0410 180 */ sra %g2,0,%o0
  1079. /* 0x0414 */ add %g2,2,%g2
  1080. /* 0x0418 177 */ sra %i2,0,%o3
  1081. /* 0x041c 180 */ sllx %o0,3,%o0
  1082. /* 0x0420 179 */ fmovs %f2,%f4
  1083. /* 0x0424 */ sllx %o3,2,%o2
  1084. /* 0x0428 */ ld [%sp+2227],%f5
  1085. /* 0x042c */ fsubd %f4,%f2,%f0
  1086. /* 0x0430 */ std %f0,[%i1+%o4]
  1087. /* 0x0434 180 */ st %o1,[%sp+2223]
  1088. /* 0x0438 */ fmovs %f2,%f4
  1089. /* 0x043c */ ld [%sp+2223],%f5
  1090. /* 0x0440 */ fsubd %f4,%f2,%f0
  1091. /* 0x0444 */ std %f0,[%i1+%o0]
  1092. /* 0x0448 */ bl,a,pt %icc,.L900000416
  1093. /* 0x044c */ ldd [%g1],%f2
  1094. .L77000164:
  1095. /* 0x0450 */ ret ! Result =
  1096. /* 0x0454 */ restore %g0,%g0,%g0
  1097. /* 0x0458 0 */ .type conv_i32_to_d32_and_d16,2
  1098. /* 0x0458 */ .size conv_i32_to_d32_and_d16,(.-conv_i32_to_d32_and_d16)
  1099. .section ".text",#alloc,#execinstr
  1100. /* 000000 0 */ .align 8
  1101. !
  1102. ! SUBROUTINE adjust_montf_result
  1103. !
  1104. ! OFFSET SOURCE LINE LABEL INSTRUCTION
  1105. .global adjust_montf_result
  1106. adjust_montf_result:
  1107. /* 000000 */ save %sp,-176,%sp
  1108. /* 0x0004 */ or %g0,%i2,%o1
  1109. /* 0x0008 */ or %g0,%i0,%i2
  1110. ! 181 ! }
  1111. ! 182 !}
  1112. ! 185 !void adjust_montf_result(unsigned int *i32, unsigned int *nint, int len)
  1113. ! 186 !{
  1114. ! 187 !long long acc;
  1115. ! 188 !int i;
  1116. ! 190 ! if(i32[len]>0) i=-1;
  1117. /* 0x000c 190 */ sra %o1,0,%g2
  1118. /* 0x0010 */ or %g0,-1,%o2
  1119. /* 0x0014 */ sllx %g2,2,%g2
  1120. /* 0x0018 */ ld [%i2+%g2],%g2
  1121. /* 0x001c */ cmp %g2,0
  1122. /* 0x0020 */ bleu,pn %icc,.L77000175
  1123. /* 0x0024 */ or %g0,%i1,%i0
  1124. /* 0x0028 */ ba .L900000511
  1125. /* 0x002c */ cmp %o2,0
  1126. .L77000175:
  1127. ! 191 ! else
  1128. ! 192 ! {
  1129. ! 193 ! for(i=len-1; i>=0; i--)
  1130. /* 0x0030 193 */ sub %o1,1,%o2
  1131. /* 0x0034 */ cmp %o2,0
  1132. /* 0x0038 */ bl,pn %icc,.L77000182
  1133. /* 0x003c */ sra %o2,0,%g2
  1134. .L900000510:
  1135. ! 194 ! {
  1136. ! 195 ! if(i32[i]!=nint[i]) break;
  1137. /* 0x0040 195 */ sllx %g2,2,%g2
  1138. /* 0x0044 */ sub %o2,1,%o0
  1139. /* 0x0048 */ ld [%i1+%g2],%g3
  1140. /* 0x004c */ ld [%i2+%g2],%g2
  1141. /* 0x0050 */ cmp %g2,%g3
  1142. /* 0x0054 */ bne,pn %icc,.L77000182
  1143. /* 0x0058 */ nop
  1144. /* 0x005c 0 */ or %g0,%o0,%o2
  1145. /* 0x0060 195 */ cmp %o0,0
  1146. /* 0x0064 */ bge,pt %icc,.L900000510
  1147. /* 0x0068 */ sra %o2,0,%g2
  1148. .L77000182:
  1149. ! 196 ! }
  1150. ! 197 ! }
  1151. ! 198 ! if((i<0)||(i32[i]>nint[i]))
  1152. /* 0x006c 198 */ cmp %o2,0
  1153. .L900000511:
  1154. /* 0x0070 198 */ bl,pn %icc,.L77000198
  1155. /* 0x0074 */ sra %o2,0,%g2
  1156. /* 0x0078 */ sllx %g2,2,%g2
  1157. /* 0x007c */ ld [%i1+%g2],%g3
  1158. /* 0x0080 */ ld [%i2+%g2],%g2
  1159. /* 0x0084 */ cmp %g2,%g3
  1160. /* 0x0088 */ bleu,pt %icc,.L77000191
  1161. /* 0x008c */ nop
  1162. .L77000198:
  1163. ! 199 ! {
  1164. ! 200 ! acc=0;
  1165. ! 201 ! for(i=0;i<len;i++)
  1166. /* 0x0090 201 */ cmp %o1,0
  1167. /* 0x0094 */ ble,pt %icc,.L77000191
  1168. /* 0x0098 */ nop
  1169. /* 0x009c 198 */ or %g0,-1,%g2
  1170. /* 0x00a0 201 */ or %g0,%o1,%g3
  1171. /* 0x00a4 198 */ srl %g2,0,%g2
  1172. /* 0x00a8 */ sub %o1,1,%g4
  1173. /* 0x00ac */ cmp %o1,9
  1174. /* 0x00b0 201 */ or %g0,0,%i1
  1175. /* 0x00b4 200 */ or %g0,0,%g5
  1176. ! 202 ! {
  1177. ! 203 ! acc=acc+(unsigned long long)(i32[i])-(unsigned long long)(nint[i]);
  1178. /* 0x00b8 203 */ or %g0,0,%o1
  1179. /* 0x00bc 201 */ bl,pn %icc,.L77000199
  1180. /* 0x00c0 */ sub %g3,4,%o7
  1181. /* 0x00c4 203 */ ld [%i2],%o1
  1182. ! 204 ! i32[i]=acc&0xffffffff;
  1183. ! 205 ! acc=acc>>32;
  1184. /* 0x00c8 205 */ or %g0,5,%i1
  1185. /* 0x00cc 203 */ ld [%i0],%o2
  1186. /* 0x00d0 201 */ or %g0,8,%o5
  1187. /* 0x00d4 */ or %g0,12,%o4
  1188. /* 0x00d8 203 */ ld [%i0+4],%o3
  1189. /* 0x00dc 201 */ or %g0,16,%g1
  1190. /* 0x00e0 203 */ ld [%i2+4],%o0
  1191. /* 0x00e4 201 */ sub %o1,%o2,%o1
  1192. /* 0x00e8 203 */ ld [%i0+8],%i3
  1193. /* 0x00ec 204 */ and %o1,%g2,%g5
  1194. /* 0x00f0 */ st %g5,[%i2]
  1195. /* 0x00f4 205 */ srax %o1,32,%g5
  1196. /* 0x00f8 201 */ sub %o0,%o3,%o0
  1197. /* 0x00fc 203 */ ld [%i0+12],%o2
  1198. /* 0x0100 201 */ add %o0,%g5,%o0
  1199. /* 0x0104 204 */ and %o0,%g2,%g5
  1200. /* 0x0108 */ st %g5,[%i2+4]
  1201. /* 0x010c 205 */ srax %o0,32,%o0
  1202. /* 0x0110 203 */ ld [%i2+8],%o1
  1203. /* 0x0114 */ ld [%i2+12],%o3
  1204. /* 0x0118 201 */ sub %o1,%i3,%o1
  1205. .L900000505:
  1206. /* 0x011c */ add %g1,4,%g3
  1207. /* 0x0120 203 */ ld [%g1+%i2],%g5
  1208. /* 0x0124 201 */ add %o1,%o0,%o0
  1209. /* 0x0128 203 */ ld [%i0+%g1],%i3
  1210. /* 0x012c 201 */ sub %o3,%o2,%o1
  1211. /* 0x0130 204 */ and %o0,%g2,%o2
  1212. /* 0x0134 */ st %o2,[%o5+%i2]
  1213. /* 0x0138 205 */ srax %o0,32,%o2
  1214. /* 0x013c */ add %i1,4,%i1
  1215. /* 0x0140 201 */ add %g1,8,%o5
  1216. /* 0x0144 203 */ ld [%g3+%i2],%o0
  1217. /* 0x0148 201 */ add %o1,%o2,%o1
  1218. /* 0x014c 203 */ ld [%i0+%g3],%o3
  1219. /* 0x0150 201 */ sub %g5,%i3,%o2
  1220. /* 0x0154 204 */ and %o1,%g2,%g5
  1221. /* 0x0158 */ st %g5,[%o4+%i2]
  1222. /* 0x015c 205 */ srax %o1,32,%g5
  1223. /* 0x0160 */ cmp %i1,%o7
  1224. /* 0x0164 201 */ add %g1,12,%o4
  1225. /* 0x0168 203 */ ld [%o5+%i2],%o1
  1226. /* 0x016c 201 */ add %o2,%g5,%o2
  1227. /* 0x0170 203 */ ld [%i0+%o5],%i3
  1228. /* 0x0174 201 */ sub %o0,%o3,%o0
  1229. /* 0x0178 204 */ and %o2,%g2,%o3
  1230. /* 0x017c */ st %o3,[%g1+%i2]
  1231. /* 0x0180 205 */ srax %o2,32,%g5
  1232. /* 0x0184 203 */ ld [%o4+%i2],%o3
  1233. /* 0x0188 201 */ add %g1,16,%g1
  1234. /* 0x018c */ add %o0,%g5,%o0
  1235. /* 0x0190 203 */ ld [%i0+%o4],%o2
  1236. /* 0x0194 201 */ sub %o1,%i3,%o1
  1237. /* 0x0198 204 */ and %o0,%g2,%g5
  1238. /* 0x019c */ st %g5,[%g3+%i2]
  1239. /* 0x01a0 205 */ ble,pt %icc,.L900000505
  1240. /* 0x01a4 */ srax %o0,32,%o0
  1241. .L900000508:
  1242. /* 0x01a8 */ add %o1,%o0,%g3
  1243. /* 0x01ac */ sub %o3,%o2,%o1
  1244. /* 0x01b0 203 */ ld [%g1+%i2],%o0
  1245. /* 0x01b4 */ ld [%i0+%g1],%o2
  1246. /* 0x01b8 205 */ srax %g3,32,%o7
  1247. /* 0x01bc 204 */ and %g3,%g2,%o3
  1248. /* 0x01c0 201 */ add %o1,%o7,%o1
  1249. /* 0x01c4 204 */ st %o3,[%o5+%i2]
  1250. /* 0x01c8 205 */ cmp %i1,%g4
  1251. /* 0x01cc 201 */ sub %o0,%o2,%o0
  1252. /* 0x01d0 204 */ and %o1,%g2,%o2
  1253. /* 0x01d4 */ st %o2,[%o4+%i2]
  1254. /* 0x01d8 205 */ srax %o1,32,%o1
  1255. /* 0x01dc 203 */ sra %i1,0,%o2
  1256. /* 0x01e0 201 */ add %o0,%o1,%o0
  1257. /* 0x01e4 205 */ srax %o0,32,%g5
  1258. /* 0x01e8 204 */ and %o0,%g2,%o1
  1259. /* 0x01ec */ st %o1,[%g1+%i2]
  1260. /* 0x01f0 205 */ bg,pn %icc,.L77000191
  1261. /* 0x01f4 */ sllx %o2,2,%o1
  1262. .L77000199:
  1263. /* 0x01f8 0 */ or %g0,%o1,%g1
  1264. .L900000509:
  1265. /* 0x01fc 203 */ ld [%o1+%i2],%o0
  1266. /* 0x0200 205 */ add %i1,1,%i1
  1267. /* 0x0204 203 */ ld [%i0+%o1],%o1
  1268. /* 0x0208 */ sra %i1,0,%o2
  1269. /* 0x020c 205 */ cmp %i1,%g4
  1270. /* 0x0210 203 */ add %g5,%o0,%o0
  1271. /* 0x0214 */ sub %o0,%o1,%o0
  1272. /* 0x0218 205 */ srax %o0,32,%g5
  1273. /* 0x021c 204 */ and %o0,%g2,%o1
  1274. /* 0x0220 */ st %o1,[%g1+%i2]
  1275. /* 0x0224 */ sllx %o2,2,%o1
  1276. /* 0x0228 205 */ ble,pt %icc,.L900000509
  1277. /* 0x022c */ or %g0,%o1,%g1
  1278. .L77000191:
  1279. /* 0x0230 */ ret ! Result =
  1280. /* 0x0234 */ restore %g0,%g0,%g0
  1281. /* 0x0238 0 */ .type adjust_montf_result,2
  1282. /* 0x0238 */ .size adjust_montf_result,(.-adjust_montf_result)
  1283. .section ".text",#alloc,#execinstr
  1284. /* 000000 0 */ .align 8
  1285. /* 000000 */ .skip 24
  1286. !
  1287. ! SUBROUTINE mont_mulf_noconv
  1288. !
  1289. ! OFFSET SOURCE LINE LABEL INSTRUCTION
  1290. .global mont_mulf_noconv
  1291. mont_mulf_noconv:
  1292. /* 000000 */ save %sp,-224,%sp
  1293. .L900000643:
  1294. /* 0x0004 */ call .+8
  1295. /* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000643-.)),%g5
  1296. /* 0x000c */ ldx [%fp+2223],%l0
  1297. ! 206 ! }
  1298. ! 207 ! }
  1299. ! 208 !}
  1300. ! 213 !/*
  1301. ! 214 !** the lengths of the input arrays should be at least the following:
  1302. ! 215 !** result[nlen+1], dm1[nlen], dm2[2*nlen+1], dt[4*nlen+2], dn[nlen], nint[nlen]
  1303. ! 216 !** all of them should be different from one another
  1304. ! 217 !**
  1305. ! 218 !*/
  1306. ! 219 !void mont_mulf_noconv(unsigned int *result,
  1307. ! 220 ! double *dm1, double *dm2, double *dt,
  1308. ! 221 ! double *dn, unsigned int *nint,
  1309. ! 222 ! int nlen, double dn0)
  1310. ! 223 !{
  1311. ! 224 ! int i, j, jj;
  1312. ! 225 ! int tmp;
  1313. ! 226 ! double digit, m2j, nextm2j, a, b;
  1314. ! 227 ! double *dptmp, *pdm1, *pdm2, *pdn, *pdtj, pdn_0, pdm1_0;
  1315. ! 229 ! pdm1=&(dm1[0]);
  1316. ! 230 ! pdm2=&(dm2[0]);
  1317. ! 231 ! pdn=&(dn[0]);
  1318. ! 232 ! pdm2[2*nlen]=Zero;
  1319. /* 0x0010 232 */ sethi %hi(Zero),%g2
  1320. /* 0x0014 223 */ fmovd %f14,%f30
  1321. /* 0x0018 */ add %g5,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000643-.)),%g5
  1322. /* 0x001c 232 */ add %g2,%lo(Zero),%g2
  1323. /* 0x0020 */ sll %l0,1,%o3
  1324. /* 0x0024 223 */ add %g5,%o7,%o4
  1325. /* 0x0028 232 */ sra %o3,0,%g5
  1326. /* 0x002c */ ldx [%o4+%g2],%o7
  1327. ! 234 ! if (nlen!=16)
  1328. ! 235 ! {
  1329. ! 236 ! for(i=0;i<4*nlen+2;i++) dt[i]=Zero;
  1330. ! 238 ! a=dt[0]=pdm1[0]*pdm2[0];
  1331. ! 239 ! digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
  1332. /* 0x0030 239 */ sethi %hi(TwoToMinus16),%g3
  1333. /* 0x0034 */ sethi %hi(TwoTo16),%g4
  1334. /* 0x0038 */ add %g3,%lo(TwoToMinus16),%g2
  1335. /* 0x003c 232 */ ldd [%o7],%f0
  1336. /* 0x0040 239 */ add %g4,%lo(TwoTo16),%g3
  1337. /* 0x0044 223 */ or %g0,%i4,%o0
  1338. /* 0x0048 232 */ sllx %g5,3,%g4
  1339. /* 0x004c 239 */ ldx [%o4+%g2],%o5
  1340. /* 0x0050 223 */ or %g0,%i5,%l3
  1341. /* 0x0054 */ or %g0,%i0,%l2
  1342. /* 0x0058 239 */ ldx [%o4+%g3],%o4
  1343. /* 0x005c 234 */ cmp %l0,16
  1344. /* 0x0060 232 */ std %f0,[%i2+%g4]
  1345. /* 0x0064 234 */ be,pn %icc,.L77000279
  1346. /* 0x0068 */ or %g0,%i3,%l4
  1347. /* 0x006c 236 */ sll %l0,2,%g2
  1348. /* 0x0070 223 */ or %g0,%o0,%i5
  1349. /* 0x0074 236 */ add %g2,2,%o0
  1350. /* 0x0078 223 */ or %g0,%i1,%i4
  1351. /* 0x007c 236 */ cmp %o0,0
  1352. /* 0x0080 223 */ or %g0,%i2,%l1
  1353. /* 0x0084 236 */ ble,a,pt %icc,.L900000657
  1354. /* 0x0088 */ ldd [%i1],%f6
  1355. ! 241 ! pdtj=&(dt[0]);
  1356. ! 242 ! for(j=jj=0;j<2*nlen;j++,jj++,pdtj++)
  1357. ! 243 ! {
  1358. ! 244 ! m2j=pdm2[j];
  1359. ! 245 ! a=pdtj[0]+pdn[0]*digit;
  1360. ! 246 ! b=pdtj[1]+pdm1[0]*pdm2[j+1]+a*TwoToMinus16;
  1361. ! 247 ! pdtj[1]=b;
  1362. ! 249 !#pragma pipeloop(0)
  1363. ! 250 ! for(i=1;i<nlen;i++)
  1364. ! 251 ! {
  1365. ! 252 ! pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
  1366. ! 253 ! }
  1367. ! 254 ! if((jj==30)) {cleanup(dt,j/2+1,2*nlen+1); jj=0;}
  1368. ! 255 !
  1369. ! 256 ! digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
  1370. ! 257 ! }
  1371. ! 258 ! }
  1372. ! 259 ! else
  1373. ! 260 ! {
  1374. ! 261 ! a=dt[0]=pdm1[0]*pdm2[0];
  1375. ! 263 ! dt[65]= dt[64]= dt[63]= dt[62]= dt[61]= dt[60]=
  1376. ! 264 ! dt[59]= dt[58]= dt[57]= dt[56]= dt[55]= dt[54]=
  1377. ! 265 ! dt[53]= dt[52]= dt[51]= dt[50]= dt[49]= dt[48]=
  1378. ! 266 ! dt[47]= dt[46]= dt[45]= dt[44]= dt[43]= dt[42]=
  1379. ! 267 ! dt[41]= dt[40]= dt[39]= dt[38]= dt[37]= dt[36]=
  1380. ! 268 ! dt[35]= dt[34]= dt[33]= dt[32]= dt[31]= dt[30]=
  1381. ! 269 ! dt[29]= dt[28]= dt[27]= dt[26]= dt[25]= dt[24]=
  1382. ! 270 ! dt[23]= dt[22]= dt[21]= dt[20]= dt[19]= dt[18]=
  1383. ! 271 ! dt[17]= dt[16]= dt[15]= dt[14]= dt[13]= dt[12]=
  1384. ! 272 ! dt[11]= dt[10]= dt[ 9]= dt[ 8]= dt[ 7]= dt[ 6]=
  1385. ! 273 ! dt[ 5]= dt[ 4]= dt[ 3]= dt[ 2]= dt[ 1]=Zero;
  1386. ! 275 ! pdn_0=pdn[0];
  1387. ! 276 ! pdm1_0=pdm1[0];
  1388. ! 278 ! digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
  1389. ! 279 ! pdtj=&(dt[0]);
  1390. ! 281 ! for(j=0;j<32;j++,pdtj++)
  1391. /* 0x008c 281 */ or %g0,%o0,%o1
  1392. /* 0x0090 236 */ sub %o0,1,%g1
  1393. /* 0x0094 */ or %g0,0,%g2
  1394. /* 0x0098 281 */ cmp %o1,5
  1395. /* 0x009c */ bl,pn %icc,.L77000280
  1396. /* 0x00a0 */ or %g0,8,%o0
  1397. /* 0x00a4 */ std %f0,[%i3]
  1398. /* 0x00a8 */ or %g0,2,%g2
  1399. /* 0x00ac */ sub %g1,2,%o1
  1400. .L900000627:
  1401. /* 0x00b0 */ add %o0,8,%g3
  1402. /* 0x00b4 */ std %f0,[%i3+%o0]
  1403. /* 0x00b8 */ add %g2,3,%g2
  1404. /* 0x00bc */ add %o0,16,%o2
  1405. /* 0x00c0 */ std %f0,[%i3+%g3]
  1406. /* 0x00c4 */ cmp %g2,%o1
  1407. /* 0x00c8 */ add %o0,24,%o0
  1408. /* 0x00cc */ ble,pt %icc,.L900000627
  1409. /* 0x00d0 */ std %f0,[%i3+%o2]
  1410. .L900000630:
  1411. /* 0x00d4 */ cmp %g2,%g1
  1412. /* 0x00d8 */ bg,pn %icc,.L77000285
  1413. /* 0x00dc */ std %f0,[%i3+%o0]
  1414. .L77000280:
  1415. /* 0x00e0 */ ldd [%o7],%f0
  1416. .L900000656:
  1417. /* 0x00e4 */ sra %g2,0,%o0
  1418. /* 0x00e8 */ add %g2,1,%g2
  1419. /* 0x00ec */ sllx %o0,3,%o0
  1420. /* 0x00f0 */ cmp %g2,%g1
  1421. /* 0x00f4 */ std %f0,[%i3+%o0]
  1422. /* 0x00f8 */ ble,a,pt %icc,.L900000656
  1423. /* 0x00fc */ ldd [%o7],%f0
  1424. .L77000285:
  1425. /* 0x0100 238 */ ldd [%i1],%f6
  1426. .L900000657:
  1427. /* 0x0104 238 */ ldd [%i2],%f8
  1428. /* 0x0108 242 */ cmp %o3,0
  1429. /* 0x010c */ sub %o3,1,%o1
  1430. /* 0x0110 239 */ ldd [%o7],%f10
  1431. /* 0x0114 */ add %o3,1,%o2
  1432. /* 0x0118 0 */ or %g0,0,%i2
  1433. /* 0x011c 238 */ fmuld %f6,%f8,%f6
  1434. /* 0x0120 */ std %f6,[%i3]
  1435. /* 0x0124 0 */ or %g0,0,%g3
  1436. /* 0x0128 239 */ ldd [%o5],%f8
  1437. /* 0x012c 0 */ or %g0,%o2,%g1
  1438. /* 0x0130 236 */ sub %l0,1,%i1
  1439. /* 0x0134 239 */ ldd [%o4],%f12
  1440. /* 0x0138 236 */ or %g0,1,%g4
  1441. /* 0x013c */ fdtox %f6,%f0
  1442. /* 0x0140 */ fmovs %f10,%f0
  1443. /* 0x0144 */ fxtod %f0,%f6
  1444. /* 0x0148 239 */ fmuld %f6,%f14,%f6
  1445. /* 0x014c */ fmuld %f6,%f8,%f8
  1446. /* 0x0150 */ fdtox %f8,%f8
  1447. /* 0x0154 */ fxtod %f8,%f8
  1448. /* 0x0158 */ fmuld %f8,%f12,%f8
  1449. /* 0x015c */ fsubd %f6,%f8,%f20
  1450. /* 0x0160 242 */ ble,pt %icc,.L900000650
  1451. /* 0x0164 */ sllx %g5,3,%g2
  1452. /* 0x0168 0 */ st %o1,[%sp+2223]
  1453. /* 0x016c 246 */ ldd [%i5],%f6
  1454. .L900000651:
  1455. /* 0x0170 246 */ sra %g4,0,%g2
  1456. /* 0x0174 */ fmuld %f6,%f20,%f6
  1457. /* 0x0178 */ ldd [%i3],%f12
  1458. /* 0x017c */ sllx %g2,3,%g2
  1459. /* 0x0180 */ ldd [%i4],%f8
  1460. /* 0x0184 250 */ cmp %l0,1
  1461. /* 0x0188 246 */ ldd [%l1+%g2],%f10
  1462. /* 0x018c 244 */ sra %i2,0,%g2
  1463. /* 0x0190 */ add %i2,1,%i0
  1464. /* 0x0194 246 */ faddd %f12,%f6,%f6
  1465. /* 0x0198 */ ldd [%o5],%f12
  1466. /* 0x019c 244 */ sllx %g2,3,%g2
  1467. /* 0x01a0 246 */ fmuld %f8,%f10,%f8
  1468. /* 0x01a4 */ ldd [%i3+8],%f10
  1469. /* 0x01a8 */ srl %i2,31,%o3
  1470. /* 0x01ac 244 */ ldd [%l1+%g2],%f18
  1471. /* 0x01b0 0 */ or %g0,1,%l5
  1472. /* 0x01b4 236 */ or %g0,2,%g2
  1473. /* 0x01b8 246 */ fmuld %f6,%f12,%f6
  1474. /* 0x01bc 250 */ or %g0,32,%o1
  1475. /* 0x01c0 */ or %g0,48,%o2
  1476. /* 0x01c4 246 */ faddd %f10,%f8,%f8
  1477. /* 0x01c8 */ faddd %f8,%f6,%f16
  1478. /* 0x01cc 250 */ ble,pn %icc,.L77000213
  1479. /* 0x01d0 */ std %f16,[%i3+8]
  1480. /* 0x01d4 */ cmp %i1,8
  1481. /* 0x01d8 */ sub %l0,3,%o3
  1482. /* 0x01dc */ bl,pn %icc,.L77000284
  1483. /* 0x01e0 */ or %g0,8,%o0
  1484. /* 0x01e4 252 */ ldd [%i5+8],%f0
  1485. /* 0x01e8 */ or %g0,6,%l5
  1486. /* 0x01ec */ ldd [%i4+8],%f2
  1487. /* 0x01f0 */ or %g0,4,%g2
  1488. /* 0x01f4 250 */ or %g0,40,%o0
  1489. /* 0x01f8 252 */ ldd [%i5+16],%f8
  1490. /* 0x01fc */ fmuld %f0,%f20,%f10
  1491. /* 0x0200 */ ldd [%i4+16],%f4
  1492. /* 0x0204 */ fmuld %f2,%f18,%f2
  1493. /* 0x0208 */ ldd [%i3+16],%f0
  1494. /* 0x020c */ fmuld %f8,%f20,%f12
  1495. /* 0x0210 */ ldd [%i4+24],%f6
  1496. /* 0x0214 */ fmuld %f4,%f18,%f4
  1497. /* 0x0218 */ ldd [%i5+24],%f8
  1498. /* 0x021c */ faddd %f2,%f10,%f2
  1499. /* 0x0220 */ ldd [%i4+32],%f14
  1500. /* 0x0224 */ fmuld %f6,%f18,%f10
  1501. /* 0x0228 */ ldd [%i5+32],%f6
  1502. /* 0x022c */ faddd %f4,%f12,%f4
  1503. /* 0x0230 */ ldd [%i4+40],%f12
  1504. /* 0x0234 */ faddd %f0,%f2,%f0
  1505. /* 0x0238 */ std %f0,[%i3+16]
  1506. /* 0x023c */ ldd [%i3+32],%f0
  1507. /* 0x0240 */ ldd [%i3+48],%f2
  1508. .L900000639:
  1509. /* 0x0244 */ add %o2,16,%l6
  1510. /* 0x0248 252 */ ldd [%i5+%o0],%f22
  1511. /* 0x024c */ add %l5,3,%l5
  1512. /* 0x0250 */ fmuld %f8,%f20,%f8
  1513. /* 0x0254 250 */ add %o0,8,%o0
  1514. /* 0x0258 252 */ ldd [%l6+%i3],%f26
  1515. /* 0x025c */ cmp %l5,%o3
  1516. /* 0x0260 */ ldd [%i4+%o0],%f24
  1517. /* 0x0264 */ faddd %f0,%f4,%f0
  1518. /* 0x0268 */ add %g2,6,%g2
  1519. /* 0x026c */ faddd %f10,%f8,%f10
  1520. /* 0x0270 */ fmuld %f14,%f18,%f4
  1521. /* 0x0274 */ std %f0,[%o1+%i3]
  1522. /* 0x0278 250 */ add %o2,32,%o1
  1523. /* 0x027c 252 */ ldd [%i5+%o0],%f8
  1524. /* 0x0280 */ fmuld %f6,%f20,%f6
  1525. /* 0x0284 250 */ add %o0,8,%o0
  1526. /* 0x0288 252 */ ldd [%o1+%i3],%f0
  1527. /* 0x028c */ ldd [%i4+%o0],%f14
  1528. /* 0x0290 */ faddd %f2,%f10,%f2
  1529. /* 0x0294 */ faddd %f4,%f6,%f10
  1530. /* 0x0298 */ fmuld %f12,%f18,%f4
  1531. /* 0x029c */ std %f2,[%o2+%i3]
  1532. /* 0x02a0 250 */ add %o2,48,%o2
  1533. /* 0x02a4 252 */ ldd [%i5+%o0],%f6
  1534. /* 0x02a8 */ fmuld %f22,%f20,%f22
  1535. /* 0x02ac 250 */ add %o0,8,%o0
  1536. /* 0x02b0 252 */ ldd [%o2+%i3],%f2
  1537. /* 0x02b4 */ ldd [%i4+%o0],%f12
  1538. /* 0x02b8 */ faddd %f26,%f10,%f10
  1539. /* 0x02bc */ std %f10,[%l6+%i3]
  1540. /* 0x02c0 */ fmuld %f24,%f18,%f10
  1541. /* 0x02c4 */ ble,pt %icc,.L900000639
  1542. /* 0x02c8 */ faddd %f4,%f22,%f4
  1543. .L900000642:
  1544. /* 0x02cc 252 */ fmuld %f8,%f20,%f24
  1545. /* 0x02d0 */ faddd %f0,%f4,%f8
  1546. /* 0x02d4 250 */ add %o2,16,%o3
  1547. /* 0x02d8 252 */ ldd [%o3+%i3],%f4
  1548. /* 0x02dc */ fmuld %f14,%f18,%f0
  1549. /* 0x02e0 */ cmp %l5,%i1
  1550. /* 0x02e4 */ std %f8,[%o1+%i3]
  1551. /* 0x02e8 */ fmuld %f12,%f18,%f8
  1552. /* 0x02ec 250 */ add %o2,32,%o1
  1553. /* 0x02f0 252 */ faddd %f10,%f24,%f12
  1554. /* 0x02f4 */ ldd [%i5+%o0],%f22
  1555. /* 0x02f8 */ fmuld %f6,%f20,%f6
  1556. /* 0x02fc */ add %g2,8,%g2
  1557. /* 0x0300 */ fmuld %f22,%f20,%f10
  1558. /* 0x0304 */ faddd %f2,%f12,%f2
  1559. /* 0x0308 */ faddd %f0,%f6,%f6
  1560. /* 0x030c */ ldd [%o1+%i3],%f0
  1561. /* 0x0310 */ std %f2,[%o2+%i3]
  1562. /* 0x0314 */ faddd %f8,%f10,%f2
  1563. /* 0x0318 */ sra %l5,0,%o2
  1564. /* 0x031c */ sllx %o2,3,%o0
  1565. /* 0x0320 */ faddd %f4,%f6,%f4
  1566. /* 0x0324 */ std %f4,[%o3+%i3]
  1567. /* 0x0328 */ faddd %f0,%f2,%f0
  1568. /* 0x032c */ std %f0,[%o1+%i3]
  1569. /* 0x0330 */ bg,a,pn %icc,.L77000213
  1570. /* 0x0334 */ srl %i2,31,%o3
  1571. .L77000284:
  1572. /* 0x0338 252 */ ldd [%i4+%o0],%f2
  1573. .L900000655:
  1574. /* 0x033c 252 */ ldd [%i5+%o0],%f0
  1575. /* 0x0340 */ fmuld %f2,%f18,%f2
  1576. /* 0x0344 */ sra %g2,0,%o0
  1577. /* 0x0348 */ sllx %o0,3,%o1
  1578. /* 0x034c */ add %l5,1,%l5
  1579. /* 0x0350 */ fmuld %f0,%f20,%f4
  1580. /* 0x0354 */ ldd [%o1+%i3],%f0
  1581. /* 0x0358 */ sra %l5,0,%o2
  1582. /* 0x035c */ sllx %o2,3,%o0
  1583. /* 0x0360 */ add %g2,2,%g2
  1584. /* 0x0364 */ cmp %l5,%i1
  1585. /* 0x0368 */ faddd %f2,%f4,%f2
  1586. /* 0x036c */ faddd %f0,%f2,%f0
  1587. /* 0x0370 */ std %f0,[%o1+%i3]
  1588. /* 0x0374 */ ble,a,pt %icc,.L900000655
  1589. /* 0x0378 */ ldd [%i4+%o0],%f2
  1590. .L900000626:
  1591. /* 0x037c */ srl %i2,31,%o3
  1592. /* 0x0380 252 */ ba .L900000654
  1593. /* 0x0384 */ cmp %g3,30
  1594. .L77000213:
  1595. /* 0x0388 254 */ cmp %g3,30
  1596. .L900000654:
  1597. /* 0x038c */ add %i2,%o3,%o0
  1598. /* 0x0390 254 */ bne,a,pt %icc,.L900000653
  1599. /* 0x0394 */ fdtox %f16,%f0
  1600. /* 0x0398 281 */ sra %o0,1,%g2
  1601. /* 0x039c */ add %g2,1,%g2
  1602. /* 0x03a0 */ ldd [%o7],%f0
  1603. /* 0x03a4 */ sll %g2,1,%o1
  1604. /* 0x03a8 */ sll %g1,1,%g2
  1605. /* 0x03ac */ or %g0,%o1,%o2
  1606. /* 0x03b0 */ fmovd %f0,%f2
  1607. /* 0x03b4 */ or %g0,%g2,%o0
  1608. /* 0x03b8 */ cmp %o1,%o0
  1609. /* 0x03bc */ sub %g2,1,%o0
  1610. /* 0x03c0 */ bge,pt %icc,.L77000215
  1611. /* 0x03c4 */ or %g0,0,%g3
  1612. /* 0x03c8 254 */ add %o1,1,%o1
  1613. /* 0x03cc 281 */ sra %o2,0,%g2
  1614. .L900000652:
  1615. /* 0x03d0 */ sllx %g2,3,%g2
  1616. /* 0x03d4 */ ldd [%o7],%f6
  1617. /* 0x03d8 */ add %o2,2,%o2
  1618. /* 0x03dc */ sra %o1,0,%g3
  1619. /* 0x03e0 */ ldd [%g2+%l4],%f8
  1620. /* 0x03e4 */ cmp %o2,%o0
  1621. /* 0x03e8 */ sllx %g3,3,%g3
  1622. /* 0x03ec */ add %o1,2,%o1
  1623. /* 0x03f0 */ ldd [%l4+%g3],%f10
  1624. /* 0x03f4 */ fdtox %f8,%f12
  1625. /* 0x03f8 */ fdtox %f10,%f4
  1626. /* 0x03fc */ fmovd %f12,%f8
  1627. /* 0x0400 */ fmovs %f6,%f12
  1628. /* 0x0404 */ fmovs %f6,%f4
  1629. /* 0x0408 */ fxtod %f12,%f6
  1630. /* 0x040c */ fxtod %f4,%f12
  1631. /* 0x0410 */ fdtox %f10,%f4
  1632. /* 0x0414 */ faddd %f6,%f2,%f6
  1633. /* 0x0418 */ std %f6,[%g2+%l4]
  1634. /* 0x041c */ faddd %f12,%f0,%f6
  1635. /* 0x0420 */ std %f6,[%l4+%g3]
  1636. /* 0x0424 */ fitod %f8,%f2
  1637. /* 0x0428 */ fitod %f4,%f0
  1638. /* 0x042c */ ble,pt %icc,.L900000652
  1639. /* 0x0430 */ sra %o2,0,%g2
  1640. .L77000233:
  1641. /* 0x0434 */ or %g0,0,%g3
  1642. .L77000215:
  1643. /* 0x0438 */ fdtox %f16,%f0
  1644. .L900000653:
  1645. /* 0x043c 256 */ ldd [%o7],%f6
  1646. /* 0x0440 */ add %g4,1,%g4
  1647. /* 0x0444 */ or %g0,%i0,%i2
  1648. /* 0x0448 */ ldd [%o5],%f8
  1649. /* 0x044c */ add %g3,1,%g3
  1650. /* 0x0450 */ add %i3,8,%i3
  1651. /* 0x0454 */ fmovs %f6,%f0
  1652. /* 0x0458 */ ldd [%o4],%f10
  1653. /* 0x045c */ ld [%sp+2223],%o0
  1654. /* 0x0460 */ fxtod %f0,%f6
  1655. /* 0x0464 */ cmp %i0,%o0
  1656. /* 0x0468 */ fmuld %f6,%f30,%f6
  1657. /* 0x046c */ fmuld %f6,%f8,%f8
  1658. /* 0x0470 */ fdtox %f8,%f8
  1659. /* 0x0474 */ fxtod %f8,%f8
  1660. /* 0x0478 */ fmuld %f8,%f10,%f8
  1661. /* 0x047c */ fsubd %f6,%f8,%f20
  1662. /* 0x0480 */ ble,a,pt %icc,.L900000651
  1663. /* 0x0484 */ ldd [%i5],%f6
  1664. .L900000625:
  1665. /* 0x0488 256 */ ba .L900000650
  1666. /* 0x048c */ sllx %g5,3,%g2
  1667. .L77000279:
  1668. /* 0x0490 261 */ ldd [%i1],%f4
  1669. /* 0x0494 */ ldd [%i2],%f6
  1670. /* 0x0498 273 */ std %f0,[%i3+8]
  1671. /* 0x049c */ std %f0,[%i3+16]
  1672. /* 0x04a0 261 */ fmuld %f4,%f6,%f6
  1673. /* 0x04a4 */ std %f6,[%i3]
  1674. /* 0x04a8 273 */ std %f0,[%i3+24]
  1675. /* 0x04ac */ std %f0,[%i3+32]
  1676. /* 0x04b0 */ fdtox %f6,%f2
  1677. /* 0x04b4 */ std %f0,[%i3+40]
  1678. /* 0x04b8 */ std %f0,[%i3+48]
  1679. /* 0x04bc */ std %f0,[%i3+56]
  1680. /* 0x04c0 */ std %f0,[%i3+64]
  1681. /* 0x04c4 */ fmovs %f0,%f2
  1682. /* 0x04c8 */ std %f0,[%i3+72]
  1683. /* 0x04cc */ std %f0,[%i3+80]
  1684. /* 0x04d0 */ std %f0,[%i3+88]
  1685. /* 0x04d4 */ std %f0,[%i3+96]
  1686. /* 0x04d8 */ std %f0,[%i3+104]
  1687. /* 0x04dc */ std %f0,[%i3+112]
  1688. /* 0x04e0 */ std %f0,[%i3+120]
  1689. /* 0x04e4 */ std %f0,[%i3+128]
  1690. /* 0x04e8 */ std %f0,[%i3+136]
  1691. /* 0x04ec */ std %f0,[%i3+144]
  1692. /* 0x04f0 */ std %f0,[%i3+152]
  1693. /* 0x04f4 */ std %f0,[%i3+160]
  1694. /* 0x04f8 */ std %f0,[%i3+168]
  1695. /* 0x04fc */ fxtod %f2,%f6
  1696. /* 0x0500 */ std %f0,[%i3+176]
  1697. /* 0x0504 281 */ or %g0,1,%o2
  1698. /* 0x0508 273 */ std %f0,[%i3+184]
  1699. ! 282 ! {
  1700. ! 284 ! m2j=pdm2[j];
  1701. ! 285 ! a=pdtj[0]+pdn_0*digit;
  1702. ! 286 ! b=pdtj[1]+pdm1_0*pdm2[j+1]+a*TwoToMinus16;
  1703. /* 0x050c 286 */ sra %o2,0,%g2
  1704. /* 0x0510 279 */ or %g0,%i3,%o3
  1705. /* 0x0514 273 */ std %f0,[%i3+192]
  1706. /* 0x0518 278 */ fmuld %f6,%f14,%f6
  1707. /* 0x051c 281 */ or %g0,0,%g1
  1708. /* 0x0520 273 */ std %f0,[%i3+200]
  1709. /* 0x0524 */ std %f0,[%i3+208]
  1710. /* 0x0528 */ std %f0,[%i3+216]
  1711. /* 0x052c */ std %f0,[%i3+224]
  1712. /* 0x0530 */ std %f0,[%i3+232]
  1713. /* 0x0534 */ std %f0,[%i3+240]
  1714. /* 0x0538 */ std %f0,[%i3+248]
  1715. /* 0x053c */ std %f0,[%i3+256]
  1716. /* 0x0540 */ std %f0,[%i3+264]
  1717. /* 0x0544 */ std %f0,[%i3+272]
  1718. /* 0x0548 */ std %f0,[%i3+280]
  1719. /* 0x054c */ std %f0,[%i3+288]
  1720. /* 0x0550 */ std %f0,[%i3+296]
  1721. /* 0x0554 */ std %f0,[%i3+304]
  1722. /* 0x0558 */ std %f0,[%i3+312]
  1723. /* 0x055c */ std %f0,[%i3+320]
  1724. /* 0x0560 */ std %f0,[%i3+328]
  1725. /* 0x0564 */ std %f0,[%i3+336]
  1726. /* 0x0568 */ std %f0,[%i3+344]
  1727. /* 0x056c */ std %f0,[%i3+352]
  1728. /* 0x0570 */ std %f0,[%i3+360]
  1729. /* 0x0574 */ std %f0,[%i3+368]
  1730. /* 0x0578 */ std %f0,[%i3+376]
  1731. /* 0x057c */ std %f0,[%i3+384]
  1732. /* 0x0580 */ std %f0,[%i3+392]
  1733. /* 0x0584 */ std %f0,[%i3+400]
  1734. /* 0x0588 */ std %f0,[%i3+408]
  1735. /* 0x058c */ std %f0,[%i3+416]
  1736. /* 0x0590 */ std %f0,[%i3+424]
  1737. /* 0x0594 */ std %f0,[%i3+432]
  1738. /* 0x0598 */ std %f0,[%i3+440]
  1739. /* 0x059c */ std %f0,[%i3+448]
  1740. /* 0x05a0 */ std %f0,[%i3+456]
  1741. /* 0x05a4 */ std %f0,[%i3+464]
  1742. /* 0x05a8 */ std %f0,[%i3+472]
  1743. /* 0x05ac */ std %f0,[%i3+480]
  1744. /* 0x05b0 */ std %f0,[%i3+488]
  1745. /* 0x05b4 */ std %f0,[%i3+496]
  1746. /* 0x05b8 278 */ ldd [%o5],%f8
  1747. /* 0x05bc */ ldd [%o4],%f10
  1748. /* 0x05c0 */ fmuld %f6,%f8,%f8
  1749. /* 0x05c4 273 */ std %f0,[%i3+504]
  1750. /* 0x05c8 */ std %f0,[%i3+512]
  1751. /* 0x05cc */ std %f0,[%i3+520]
  1752. /* 0x05d0 */ fdtox %f8,%f8
  1753. /* 0x05d4 275 */ ldd [%o0],%f0
  1754. /* 0x05d8 */ fxtod %f8,%f8
  1755. /* 0x05dc */ fmuld %f8,%f10,%f8
  1756. /* 0x05e0 */ fsubd %f6,%f8,%f2
  1757. ! 287 ! pdtj[1]=b;
  1758. ! 289 ! /**** this loop will be fully unrolled:
  1759. ! 290 ! for(i=1;i<16;i++)
  1760. ! 291 ! {
  1761. ! 292 ! pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
  1762. ! 293 ! }
  1763. ! 294 ! *************************************/
  1764. ! 295 ! pdtj[2]+=pdm1[1]*m2j+pdn[1]*digit;
  1765. ! 296 ! pdtj[4]+=pdm1[2]*m2j+pdn[2]*digit;
  1766. ! 297 ! pdtj[6]+=pdm1[3]*m2j+pdn[3]*digit;
  1767. ! 298 ! pdtj[8]+=pdm1[4]*m2j+pdn[4]*digit;
  1768. ! 299 ! pdtj[10]+=pdm1[5]*m2j+pdn[5]*digit;
  1769. ! 300 ! pdtj[12]+=pdm1[6]*m2j+pdn[6]*digit;
  1770. ! 301 ! pdtj[14]+=pdm1[7]*m2j+pdn[7]*digit;
  1771. ! 302 ! pdtj[16]+=pdm1[8]*m2j+pdn[8]*digit;
  1772. ! 303 ! pdtj[18]+=pdm1[9]*m2j+pdn[9]*digit;
  1773. ! 304 ! pdtj[20]+=pdm1[10]*m2j+pdn[10]*digit;
  1774. ! 305 ! pdtj[22]+=pdm1[11]*m2j+pdn[11]*digit;
  1775. ! 306 ! pdtj[24]+=pdm1[12]*m2j+pdn[12]*digit;
  1776. ! 307 ! pdtj[26]+=pdm1[13]*m2j+pdn[13]*digit;
  1777. ! 308 ! pdtj[28]+=pdm1[14]*m2j+pdn[14]*digit;
  1778. ! 309 ! pdtj[30]+=pdm1[15]*m2j+pdn[15]*digit;
  1779. ! 310 ! /* no need for cleenup, cannot overflow */
  1780. ! 311 ! digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
  1781. fmovd %f2,%f0 ! hand modified
  1782. fmovd %f30,%f18 ! hand modified
  1783. ldd [%o0],%f2
  1784. ldd [%o3],%f8
  1785. ldd [%i1],%f10
  1786. ldd [%o5],%f14 ! hand modified
  1787. ldd [%o4],%f16 ! hand modified
  1788. ldd [%i2],%f24
  1789. ldd [%i1+8],%f26
  1790. ldd [%i1+16],%f40
  1791. ldd [%i1+48],%f46
  1792. ldd [%i1+56],%f30
  1793. ldd [%i1+64],%f54
  1794. ldd [%i1+104],%f34
  1795. ldd [%i1+112],%f58
  1796. ldd [%o0+8],%f28
  1797. ldd [%o0+104],%f38
  1798. ldd [%o0+112],%f60
  1799. .L99999999: !1
  1800. ldd [%i1+24],%f32
  1801. fmuld %f0,%f2,%f4 !2
  1802. ldd [%o0+24],%f36
  1803. fmuld %f26,%f24,%f20 !3
  1804. ldd [%i1+40],%f42
  1805. fmuld %f28,%f0,%f22 !4
  1806. ldd [%o0+40],%f44
  1807. fmuld %f32,%f24,%f32 !5
  1808. ldd [%i2+8],%f6
  1809. faddd %f4,%f8,%f4
  1810. fmuld %f36,%f0,%f36 !6
  1811. add %i2,8,%i2
  1812. ldd [%o0+56],%f50
  1813. fmuld %f42,%f24,%f42 !7
  1814. ldd [%i1+72],%f52
  1815. faddd %f20,%f22,%f20
  1816. fmuld %f44,%f0,%f44 !8
  1817. ldd [%o3+16],%f22
  1818. fmuld %f10,%f6,%f12 !9
  1819. ldd [%o0+72],%f56
  1820. faddd %f32,%f36,%f32
  1821. fmuld %f14,%f4,%f4 !10
  1822. ldd [%o3+48],%f36
  1823. fmuld %f30,%f24,%f48 !11
  1824. ldd [%o3+8],%f8
  1825. faddd %f20,%f22,%f20
  1826. fmuld %f50,%f0,%f50 !12
  1827. std %f20,[%o3+16]
  1828. faddd %f42,%f44,%f42
  1829. fmuld %f52,%f24,%f52 !13
  1830. ldd [%o3+80],%f44
  1831. faddd %f4,%f12,%f4
  1832. fmuld %f56,%f0,%f56 !14
  1833. ldd [%i1+88],%f20
  1834. faddd %f32,%f36,%f32 !15
  1835. ldd [%o0+88],%f22
  1836. faddd %f48,%f50,%f48 !16
  1837. ldd [%o3+112],%f50
  1838. faddd %f52,%f56,%f52 !17
  1839. ldd [%o3+144],%f56
  1840. faddd %f4,%f8,%f8
  1841. fmuld %f20,%f24,%f20 !18
  1842. std %f32,[%o3+48]
  1843. faddd %f42,%f44,%f42
  1844. fmuld %f22,%f0,%f22 !19
  1845. std %f42,[%o3+80]
  1846. faddd %f48,%f50,%f48
  1847. fmuld %f34,%f24,%f32 !20
  1848. std %f48,[%o3+112]
  1849. faddd %f52,%f56,%f52
  1850. fmuld %f38,%f0,%f36 !21
  1851. ldd [%i1+120],%f42
  1852. fdtox %f8,%f4 !22
  1853. std %f52,[%o3+144]
  1854. faddd %f20,%f22,%f20 !23
  1855. ldd [%o0+120],%f44 !24
  1856. ldd [%o3+176],%f22
  1857. faddd %f32,%f36,%f32
  1858. fmuld %f42,%f24,%f42 !25
  1859. ldd [%o0+16],%f50
  1860. fmovs %f17,%f4 !26
  1861. ldd [%i1+32],%f52
  1862. fmuld %f44,%f0,%f44 !27
  1863. ldd [%o0+32],%f56
  1864. fmuld %f40,%f24,%f48 !28
  1865. ldd [%o3+208],%f36
  1866. faddd %f20,%f22,%f20
  1867. fmuld %f50,%f0,%f50 !29
  1868. std %f20,[%o3+176]
  1869. fxtod %f4,%f4
  1870. fmuld %f52,%f24,%f52 !30
  1871. ldd [%o0+48],%f22
  1872. faddd %f42,%f44,%f42
  1873. fmuld %f56,%f0,%f56 !31
  1874. ldd [%o3+240],%f44
  1875. faddd %f32,%f36,%f32 !32
  1876. std %f32,[%o3+208]
  1877. faddd %f48,%f50,%f48
  1878. fmuld %f46,%f24,%f20 !33
  1879. ldd [%o3+32],%f50
  1880. fmuld %f4,%f18,%f12 !34
  1881. ldd [%o0+64],%f36
  1882. faddd %f52,%f56,%f52
  1883. fmuld %f22,%f0,%f22 !35
  1884. ldd [%o3+64],%f56
  1885. faddd %f42,%f44,%f42 !36
  1886. std %f42,[%o3+240]
  1887. faddd %f48,%f50,%f48
  1888. fmuld %f54,%f24,%f32 !37
  1889. std %f48,[%o3+32]
  1890. fmuld %f12,%f14,%f4 !38
  1891. ldd [%i1+80],%f42
  1892. faddd %f52,%f56,%f56 ! yes, tmp52!
  1893. fmuld %f36,%f0,%f36 !39
  1894. ldd [%o0+80],%f44
  1895. faddd %f20,%f22,%f20 !40
  1896. ldd [%i1+96],%f48
  1897. fmuld %f58,%f24,%f52 !41
  1898. ldd [%o0+96],%f50
  1899. fdtox %f4,%f4
  1900. fmuld %f42,%f24,%f42 !42
  1901. std %f56,[%o3+64] ! yes, tmp52!
  1902. faddd %f32,%f36,%f32
  1903. fmuld %f44,%f0,%f44 !43
  1904. ldd [%o3+96],%f22
  1905. fmuld %f48,%f24,%f48 !44
  1906. ldd [%o3+128],%f36
  1907. fmovd %f6,%f24
  1908. fmuld %f50,%f0,%f50 !45
  1909. fxtod %f4,%f4
  1910. fmuld %f60,%f0,%f56 !46
  1911. add %o3,8,%o3
  1912. faddd %f42,%f44,%f42 !47
  1913. ldd [%o3+160-8],%f44
  1914. faddd %f20,%f22,%f20 !48
  1915. std %f20,[%o3+96-8]
  1916. faddd %f48,%f50,%f48 !49
  1917. ldd [%o3+192-8],%f50
  1918. faddd %f52,%f56,%f52
  1919. fmuld %f4,%f16,%f4 !50
  1920. ldd [%o3+224-8],%f56
  1921. faddd %f32,%f36,%f32 !51
  1922. std %f32,[%o3+128-8]
  1923. faddd %f42,%f44,%f42 !52
  1924. add %g1,1,%g1
  1925. std %f42,[%o3+160-8]
  1926. faddd %f48,%f50,%f48 !53
  1927. cmp %g1,31
  1928. std %f48,[%o3+192-8]
  1929. fsubd %f12,%f4,%f0 !54
  1930. faddd %f52,%f56,%f52
  1931. ble,pt %icc,.L99999999
  1932. std %f52,[%o3+224-8] !55
  1933. std %f8,[%o3]
  1934. ! 312 ! }
  1935. ! 313 ! }
  1936. ! 315 ! conv_d16_to_i32(result,dt+2*nlen,(long long *)dt,nlen+1);
  1937. /* 0x0844 315 */ sllx %g5,3,%g2
  1938. .L900000650:
  1939. /* 0x0848 315 */ ldd [%g2+%l4],%f2
  1940. /* 0x084c */ add %l4,%g2,%o0
  1941. /* 0x0850 */ or %g0,0,%g1
  1942. /* 0x0854 */ ldd [%o0+8],%f4
  1943. /* 0x0858 */ or %g0,0,%i2
  1944. /* 0x085c */ cmp %l0,0
  1945. /* 0x0860 */ fdtox %f2,%f2
  1946. /* 0x0864 */ std %f2,[%sp+2255]
  1947. /* 0x0868 311 */ sethi %hi(0xfc00),%o3
  1948. /* 0x086c 315 */ fdtox %f4,%f2
  1949. /* 0x0870 */ std %f2,[%sp+2247]
  1950. /* 0x0874 311 */ or %g0,-1,%o2
  1951. /* 0x0878 */ srl %o2,0,%o5
  1952. /* 0x087c */ or %g0,2,%g5
  1953. /* 0x0880 */ sub %l0,1,%g3
  1954. /* 0x0884 */ or %g0,%o0,%o7
  1955. /* 0x0888 */ add %o3,1023,%o4
  1956. /* 0x088c 315 */ or %g0,64,%o3
  1957. /* 0x0890 */ ldx [%sp+2255],%i0
  1958. /* 0x0894 */ sub %l0,2,%o1
  1959. /* 0x0898 */ ldx [%sp+2247],%i1
  1960. /* 0x089c */ ble,pt %icc,.L900000648
  1961. /* 0x08a0 */ sethi %hi(0xfc00),%g2
  1962. /* 0x08a4 */ cmp %l0,6
  1963. /* 0x08a8 */ and %i0,%o5,%o2
  1964. /* 0x08ac */ bl,pn %icc,.L77000287
  1965. /* 0x08b0 */ or %g0,3,%g4
  1966. /* 0x08b4 */ ldd [%o7+16],%f0
  1967. /* 0x08b8 */ and %i1,%o4,%i3
  1968. /* 0x08bc */ sllx %i3,16,%o0
  1969. /* 0x08c0 */ or %g0,5,%g4
  1970. /* 0x08c4 */ srax %i1,16,%i4
  1971. /* 0x08c8 */ fdtox %f0,%f0
  1972. /* 0x08cc */ std %f0,[%sp+2239]
  1973. /* 0x08d0 */ srax %i0,32,%i1
  1974. /* 0x08d4 */ add %o2,%o0,%i5
  1975. /* 0x08d8 */ ldd [%o7+24],%f0
  1976. /* 0x08dc */ and %i5,%o5,%l1
  1977. /* 0x08e0 */ or %g0,72,%o2
  1978. /* 0x08e4 */ or %g0,4,%o0
  1979. /* 0x08e8 */ or %g0,4,%g5
  1980. /* 0x08ec */ ldx [%sp+2239],%g1
  1981. /* 0x08f0 */ fdtox %f0,%f0
  1982. /* 0x08f4 */ or %g0,4,%i2
  1983. /* 0x08f8 */ std %f0,[%sp+2231]
  1984. /* 0x08fc */ ldd [%o7+40],%f2
  1985. /* 0x0900 */ and %g1,%o5,%i3
  1986. /* 0x0904 */ ldd [%o7+32],%f0
  1987. /* 0x0908 */ srax %g1,32,%g1
  1988. /* 0x090c */ ldd [%o7+56],%f4
  1989. /* 0x0910 */ fdtox %f2,%f2
  1990. /* 0x0914 */ ldx [%sp+2231],%g2
  1991. /* 0x0918 */ fdtox %f0,%f0
  1992. /* 0x091c */ st %l1,[%l2]
  1993. /* 0x0920 */ srax %i5,32,%l1
  1994. /* 0x0924 */ fdtox %f4,%f4
  1995. /* 0x0928 */ std %f2,[%sp+2231]
  1996. /* 0x092c */ and %g2,%o4,%i5
  1997. /* 0x0930 */ add %i4,%l1,%i4
  1998. /* 0x0934 */ std %f0,[%sp+2239]
  1999. /* 0x0938 */ sllx %i5,16,%i0
  2000. /* 0x093c */ add %i1,%i4,%i1
  2001. /* 0x0940 */ ldd [%o7+48],%f2
  2002. /* 0x0944 */ srax %g2,16,%g2
  2003. /* 0x0948 */ add %i3,%i0,%i0
  2004. /* 0x094c */ ldd [%o7+72],%f0
  2005. /* 0x0950 */ add %i0,%i1,%i3
  2006. /* 0x0954 */ srax %i3,32,%i4
  2007. /* 0x0958 */ fdtox %f2,%f2
  2008. /* 0x095c */ and %i3,%o5,%i3
  2009. /* 0x0960 */ ldx [%sp+2231],%i1
  2010. /* 0x0964 */ add %g2,%i4,%g2
  2011. /* 0x0968 */ ldx [%sp+2239],%i0
  2012. /* 0x096c */ add %g1,%g2,%g1
  2013. /* 0x0970 */ std %f2,[%sp+2239]
  2014. /* 0x0974 */ std %f4,[%sp+2231]
  2015. /* 0x0978 */ ldd [%o7+64],%f2
  2016. /* 0x097c */ st %i3,[%l2+4]
  2017. .L900000631:
  2018. /* 0x0980 */ ldx [%sp+2231],%i3
  2019. /* 0x0984 */ add %i2,2,%i2
  2020. /* 0x0988 */ add %g4,4,%g4
  2021. /* 0x098c */ ldx [%sp+2239],%i5
  2022. /* 0x0990 */ add %o2,16,%o2
  2023. /* 0x0994 */ and %i1,%o4,%g2
  2024. /* 0x0998 */ sllx %g2,16,%i4
  2025. /* 0x099c */ and %i0,%o5,%g2
  2026. /* 0x09a0 */ ldd [%o7+%o2],%f4
  2027. /* 0x09a4 */ fdtox %f0,%f0
  2028. /* 0x09a8 */ std %f0,[%sp+2231]
  2029. /* 0x09ac */ srax %i1,16,%i1
  2030. /* 0x09b0 */ add %g2,%i4,%g2
  2031. /* 0x09b4 */ fdtox %f2,%f0
  2032. /* 0x09b8 */ add %o3,16,%o3
  2033. /* 0x09bc */ std %f0,[%sp+2239]
  2034. /* 0x09c0 */ add %g2,%g1,%g1
  2035. /* 0x09c4 */ ldd [%o7+%o3],%f2
  2036. /* 0x09c8 */ srax %g1,32,%i4
  2037. /* 0x09cc */ cmp %i2,%o1
  2038. /* 0x09d0 */ srax %i0,32,%g2
  2039. /* 0x09d4 */ add %i1,%i4,%i0
  2040. /* 0x09d8 */ add %g2,%i0,%i4
  2041. /* 0x09dc */ add %o0,4,%o0
  2042. /* 0x09e0 */ and %g1,%o5,%g2
  2043. /* 0x09e4 */ or %g0,%i5,%g1
  2044. /* 0x09e8 */ st %g2,[%l2+%o0]
  2045. /* 0x09ec */ add %g5,4,%g5
  2046. /* 0x09f0 */ ldx [%sp+2231],%i1
  2047. /* 0x09f4 */ ldx [%sp+2239],%i0
  2048. /* 0x09f8 */ add %o2,16,%o2
  2049. /* 0x09fc */ and %i3,%o4,%g2
  2050. /* 0x0a00 */ sllx %g2,16,%i5
  2051. /* 0x0a04 */ and %g1,%o5,%g2
  2052. /* 0x0a08 */ ldd [%o7+%o2],%f0
  2053. /* 0x0a0c */ fdtox %f4,%f4
  2054. /* 0x0a10 */ std %f4,[%sp+2231]
  2055. /* 0x0a14 */ srax %i3,16,%i3
  2056. /* 0x0a18 */ add %g2,%i5,%g2
  2057. /* 0x0a1c */ fdtox %f2,%f2
  2058. /* 0x0a20 */ add %o3,16,%o3
  2059. /* 0x0a24 */ std %f2,[%sp+2239]
  2060. /* 0x0a28 */ add %g2,%i4,%g2
  2061. /* 0x0a2c */ ldd [%o7+%o3],%f2
  2062. /* 0x0a30 */ srax %g2,32,%i4
  2063. /* 0x0a34 */ srax %g1,32,%g1
  2064. /* 0x0a38 */ add %i3,%i4,%i3
  2065. /* 0x0a3c */ add %g1,%i3,%g1
  2066. /* 0x0a40 */ add %o0,4,%o0
  2067. /* 0x0a44 */ and %g2,%o5,%g2
  2068. /* 0x0a48 */ ble,pt %icc,.L900000631
  2069. /* 0x0a4c */ st %g2,[%l2+%o0]
  2070. .L900000634:
  2071. /* 0x0a50 */ srax %i1,16,%i5
  2072. /* 0x0a54 */ ldx [%sp+2231],%o1
  2073. /* 0x0a58 */ and %i1,%o4,%i3
  2074. /* 0x0a5c */ sllx %i3,16,%i3
  2075. /* 0x0a60 */ ldx [%sp+2239],%i4
  2076. /* 0x0a64 */ and %i0,%o5,%g2
  2077. /* 0x0a68 */ add %g2,%i3,%g2
  2078. /* 0x0a6c */ and %o1,%o4,%i3
  2079. /* 0x0a70 */ fdtox %f0,%f4
  2080. /* 0x0a74 */ sllx %i3,16,%i3
  2081. /* 0x0a78 */ std %f4,[%sp+2231]
  2082. /* 0x0a7c */ add %g2,%g1,%g2
  2083. /* 0x0a80 */ srax %g2,32,%l1
  2084. /* 0x0a84 */ and %i4,%o5,%i1
  2085. /* 0x0a88 */ fdtox %f2,%f0
  2086. /* 0x0a8c */ srax %i0,32,%g1
  2087. /* 0x0a90 */ std %f0,[%sp+2239]
  2088. /* 0x0a94 */ add %i5,%l1,%i0
  2089. /* 0x0a98 */ srax %o1,16,%o1
  2090. /* 0x0a9c */ add %g1,%i0,%i0
  2091. /* 0x0aa0 */ add %o0,4,%g1
  2092. /* 0x0aa4 */ add %i1,%i3,%o0
  2093. /* 0x0aa8 */ and %g2,%o5,%g2
  2094. /* 0x0aac */ st %g2,[%l2+%g1]
  2095. /* 0x0ab0 */ add %o0,%i0,%o0
  2096. /* 0x0ab4 */ srax %o0,32,%i3
  2097. /* 0x0ab8 */ ldx [%sp+2231],%i1
  2098. /* 0x0abc */ add %g1,4,%g1
  2099. /* 0x0ac0 */ ldx [%sp+2239],%i0
  2100. /* 0x0ac4 */ and %o0,%o5,%g2
  2101. /* 0x0ac8 */ add %o1,%i3,%o1
  2102. /* 0x0acc */ srax %i4,32,%o0
  2103. /* 0x0ad0 */ cmp %i2,%g3
  2104. /* 0x0ad4 */ st %g2,[%l2+%g1]
  2105. /* 0x0ad8 */ bg,pn %icc,.L77000236
  2106. /* 0x0adc */ add %o0,%o1,%g1
  2107. /* 0x0ae0 */ add %g4,6,%g4
  2108. /* 0x0ae4 */ add %g5,6,%g5
  2109. .L77000287:
  2110. /* 0x0ae8 */ sra %g5,0,%o1
  2111. .L900000647:
  2112. /* 0x0aec */ sllx %o1,3,%o2
  2113. /* 0x0af0 */ and %i0,%o5,%o0
  2114. /* 0x0af4 */ ldd [%o7+%o2],%f0
  2115. /* 0x0af8 */ sra %g4,0,%o2
  2116. /* 0x0afc */ and %i1,%o4,%o1
  2117. /* 0x0b00 */ sllx %o2,3,%o2
  2118. /* 0x0b04 */ add %g1,%o0,%o0
  2119. /* 0x0b08 */ fdtox %f0,%f0
  2120. /* 0x0b0c */ std %f0,[%sp+2239]
  2121. /* 0x0b10 */ sllx %o1,16,%o1
  2122. /* 0x0b14 */ add %o0,%o1,%o1
  2123. /* 0x0b18 */ add %g5,2,%g5
  2124. /* 0x0b1c */ ldd [%o7+%o2],%f0
  2125. /* 0x0b20 */ srax %o1,32,%g1
  2126. /* 0x0b24 */ and %o1,%o5,%o2
  2127. /* 0x0b28 */ srax %i1,16,%o0
  2128. /* 0x0b2c */ add %g4,2,%g4
  2129. /* 0x0b30 */ fdtox %f0,%f0
  2130. /* 0x0b34 */ std %f0,[%sp+2231]
  2131. /* 0x0b38 */ sra %i2,0,%o1
  2132. /* 0x0b3c */ sllx %o1,2,%o1
  2133. /* 0x0b40 */ add %o0,%g1,%g2
  2134. /* 0x0b44 */ srax %i0,32,%g1
  2135. /* 0x0b48 */ add %i2,1,%i2
  2136. /* 0x0b4c */ add %g1,%g2,%g1
  2137. /* 0x0b50 */ cmp %i2,%g3
  2138. /* 0x0b54 */ ldx [%sp+2239],%o3
  2139. /* 0x0b58 */ ldx [%sp+2231],%i1
  2140. /* 0x0b5c */ st %o2,[%l2+%o1]
  2141. /* 0x0b60 */ or %g0,%o3,%i0
  2142. /* 0x0b64 */ ble,pt %icc,.L900000647
  2143. /* 0x0b68 */ sra %g5,0,%o1
  2144. .L77000236:
  2145. /* 0x0b6c */ sethi %hi(0xfc00),%g2
  2146. .L900000648:
  2147. /* 0x0b70 */ or %g0,-1,%o0
  2148. /* 0x0b74 */ add %g2,1023,%g2
  2149. /* 0x0b78 */ srl %o0,0,%g3
  2150. /* 0x0b7c */ and %i1,%g2,%g2
  2151. /* 0x0b80 */ and %i0,%g3,%g4
  2152. /* 0x0b84 */ sllx %g2,16,%g2
  2153. /* 0x0b88 */ add %g1,%g4,%g4
  2154. /* 0x0b8c */ sra %i2,0,%g5
  2155. /* 0x0b90 */ add %g4,%g2,%g4
  2156. /* 0x0b94 */ sllx %g5,2,%g2
  2157. /* 0x0b98 */ and %g4,%g3,%g3
  2158. /* 0x0b9c */ st %g3,[%l2+%g2]
  2159. ! 317 ! adjust_montf_result(result,nint,nlen);
  2160. /* 0x0ba0 317 */ sra %l0,0,%g4
  2161. /* 0x0ba4 */ sllx %g4,2,%g2
  2162. /* 0x0ba8 */ ld [%l2+%g2],%g2
  2163. /* 0x0bac */ cmp %g2,0
  2164. /* 0x0bb0 */ bleu,pn %icc,.L77000241
  2165. /* 0x0bb4 */ or %g0,-1,%o1
  2166. /* 0x0bb8 */ ba .L900000646
  2167. /* 0x0bbc */ cmp %o1,0
  2168. .L77000241:
  2169. /* 0x0bc0 */ sub %l0,1,%o1
  2170. /* 0x0bc4 */ cmp %o1,0
  2171. /* 0x0bc8 */ bl,pn %icc,.L77000244
  2172. /* 0x0bcc */ sra %o1,0,%g2
  2173. .L900000645:
  2174. /* 0x0bd0 */ sllx %g2,2,%g2
  2175. /* 0x0bd4 */ sub %o1,1,%o0
  2176. /* 0x0bd8 */ ld [%l3+%g2],%g3
  2177. /* 0x0bdc */ ld [%l2+%g2],%g2
  2178. /* 0x0be0 */ cmp %g2,%g3
  2179. /* 0x0be4 */ bne,pn %icc,.L77000244
  2180. /* 0x0be8 */ nop
  2181. /* 0x0bec 0 */ or %g0,%o0,%o1
  2182. /* 0x0bf0 317 */ cmp %o0,0
  2183. /* 0x0bf4 */ bge,pt %icc,.L900000645
  2184. /* 0x0bf8 */ sra %o1,0,%g2
  2185. .L77000244:
  2186. /* 0x0bfc */ cmp %o1,0
  2187. .L900000646:
  2188. /* 0x0c00 */ bl,pn %icc,.L77000288
  2189. /* 0x0c04 */ sra %o1,0,%g2
  2190. /* 0x0c08 */ sllx %g2,2,%g2
  2191. /* 0x0c0c */ ld [%l3+%g2],%g3
  2192. /* 0x0c10 */ ld [%l2+%g2],%g2
  2193. /* 0x0c14 */ cmp %g2,%g3
  2194. /* 0x0c18 */ bleu,pt %icc,.L77000224
  2195. /* 0x0c1c */ nop
  2196. .L77000288:
  2197. /* 0x0c20 */ cmp %l0,0
  2198. /* 0x0c24 */ ble,pt %icc,.L77000224
  2199. /* 0x0c28 */ nop
  2200. /* 0x0c2c 317 */ or %g0,-1,%g2
  2201. /* 0x0c30 315 */ or %g0,0,%i0
  2202. /* 0x0c34 317 */ srl %g2,0,%g2
  2203. /* 0x0c38 315 */ or %g0,0,%g4
  2204. /* 0x0c3c */ or %g0,0,%o1
  2205. /* 0x0c40 317 */ sub %l0,1,%g5
  2206. /* 0x0c44 */ cmp %l0,9
  2207. /* 0x0c48 315 */ or %g0,8,%o5
  2208. /* 0x0c4c */ bl,pn %icc,.L77000289
  2209. /* 0x0c50 */ sub %l0,4,%o7
  2210. /* 0x0c54 */ ld [%l2],%o1
  2211. /* 0x0c58 */ or %g0,5,%i0
  2212. /* 0x0c5c */ ld [%l3],%o2
  2213. /* 0x0c60 */ or %g0,12,%o4
  2214. /* 0x0c64 */ or %g0,16,%g1
  2215. /* 0x0c68 */ ld [%l3+4],%o3
  2216. /* 0x0c6c */ ld [%l2+4],%o0
  2217. /* 0x0c70 */ sub %o1,%o2,%o1
  2218. /* 0x0c74 */ ld [%l3+8],%i1
  2219. /* 0x0c78 */ and %o1,%g2,%g4
  2220. /* 0x0c7c */ st %g4,[%l2]
  2221. /* 0x0c80 */ srax %o1,32,%g4
  2222. /* 0x0c84 */ sub %o0,%o3,%o0
  2223. /* 0x0c88 */ ld [%l3+12],%o2
  2224. /* 0x0c8c */ add %o0,%g4,%o0
  2225. /* 0x0c90 */ and %o0,%g2,%g4
  2226. /* 0x0c94 */ st %g4,[%l2+4]
  2227. /* 0x0c98 */ srax %o0,32,%o0
  2228. /* 0x0c9c */ ld [%l2+8],%o1
  2229. /* 0x0ca0 */ ld [%l2+12],%o3
  2230. /* 0x0ca4 */ sub %o1,%i1,%o1
  2231. .L900000635:
  2232. /* 0x0ca8 */ add %g1,4,%g3
  2233. /* 0x0cac */ ld [%g1+%l2],%g4
  2234. /* 0x0cb0 */ add %o1,%o0,%o0
  2235. /* 0x0cb4 */ ld [%l3+%g1],%i1
  2236. /* 0x0cb8 */ sub %o3,%o2,%o1
  2237. /* 0x0cbc */ and %o0,%g2,%o2
  2238. /* 0x0cc0 */ st %o2,[%o5+%l2]
  2239. /* 0x0cc4 */ srax %o0,32,%o2
  2240. /* 0x0cc8 */ add %i0,4,%i0
  2241. /* 0x0ccc */ add %g1,8,%o5
  2242. /* 0x0cd0 */ ld [%g3+%l2],%o0
  2243. /* 0x0cd4 */ add %o1,%o2,%o1
  2244. /* 0x0cd8 */ ld [%l3+%g3],%o3
  2245. /* 0x0cdc */ sub %g4,%i1,%o2
  2246. /* 0x0ce0 */ and %o1,%g2,%g4
  2247. /* 0x0ce4 */ st %g4,[%o4+%l2]
  2248. /* 0x0ce8 */ srax %o1,32,%g4
  2249. /* 0x0cec */ cmp %i0,%o7
  2250. /* 0x0cf0 */ add %g1,12,%o4
  2251. /* 0x0cf4 */ ld [%o5+%l2],%o1
  2252. /* 0x0cf8 */ add %o2,%g4,%o2
  2253. /* 0x0cfc */ ld [%l3+%o5],%i1
  2254. /* 0x0d00 */ sub %o0,%o3,%o0
  2255. /* 0x0d04 */ and %o2,%g2,%o3
  2256. /* 0x0d08 */ st %o3,[%g1+%l2]
  2257. /* 0x0d0c */ srax %o2,32,%g4
  2258. /* 0x0d10 */ ld [%o4+%l2],%o3
  2259. /* 0x0d14 */ add %g1,16,%g1
  2260. /* 0x0d18 */ add %o0,%g4,%o0
  2261. /* 0x0d1c */ ld [%l3+%o4],%o2
  2262. /* 0x0d20 */ sub %o1,%i1,%o1
  2263. /* 0x0d24 */ and %o0,%g2,%g4
  2264. /* 0x0d28 */ st %g4,[%g3+%l2]
  2265. /* 0x0d2c */ ble,pt %icc,.L900000635
  2266. /* 0x0d30 */ srax %o0,32,%o0
  2267. .L900000638:
  2268. /* 0x0d34 */ add %o1,%o0,%g3
  2269. /* 0x0d38 */ sub %o3,%o2,%o1
  2270. /* 0x0d3c */ ld [%g1+%l2],%o0
  2271. /* 0x0d40 */ ld [%l3+%g1],%o2
  2272. /* 0x0d44 */ srax %g3,32,%o7
  2273. /* 0x0d48 */ and %g3,%g2,%o3
  2274. /* 0x0d4c */ add %o1,%o7,%o1
  2275. /* 0x0d50 */ st %o3,[%o5+%l2]
  2276. /* 0x0d54 */ cmp %i0,%g5
  2277. /* 0x0d58 */ sub %o0,%o2,%o0
  2278. /* 0x0d5c */ and %o1,%g2,%o2
  2279. /* 0x0d60 */ st %o2,[%o4+%l2]
  2280. /* 0x0d64 */ srax %o1,32,%o1
  2281. /* 0x0d68 */ sra %i0,0,%o2
  2282. /* 0x0d6c */ add %o0,%o1,%o0
  2283. /* 0x0d70 */ srax %o0,32,%g4
  2284. /* 0x0d74 */ and %o0,%g2,%o1
  2285. /* 0x0d78 */ st %o1,[%g1+%l2]
  2286. /* 0x0d7c */ bg,pn %icc,.L77000224
  2287. /* 0x0d80 */ sllx %o2,2,%o1
  2288. .L77000289:
  2289. /* 0x0d84 0 */ or %g0,%o1,%g1
  2290. .L900000644:
  2291. /* 0x0d88 */ ld [%o1+%l2],%o0
  2292. /* 0x0d8c */ add %i0,1,%i0
  2293. /* 0x0d90 */ ld [%l3+%o1],%o1
  2294. /* 0x0d94 */ sra %i0,0,%o2
  2295. /* 0x0d98 */ cmp %i0,%g5
  2296. /* 0x0d9c */ add %g4,%o0,%o0
  2297. /* 0x0da0 */ sub %o0,%o1,%o0
  2298. /* 0x0da4 */ srax %o0,32,%g4
  2299. /* 0x0da8 */ and %o0,%g2,%o1
  2300. /* 0x0dac */ st %o1,[%g1+%l2]
  2301. /* 0x0db0 */ sllx %o2,2,%o1
  2302. /* 0x0db4 */ ble,pt %icc,.L900000644
  2303. /* 0x0db8 */ or %g0,%o1,%g1
  2304. .L77000224:
  2305. /* 0x0dbc */ ret ! Result =
  2306. /* 0x0dc0 */ restore %g0,%g0,%g0
  2307. /* 0x0dc4 0 */ .type mont_mulf_noconv,2
  2308. /* 0x0dc4 */ .size mont_mulf_noconv,(.-mont_mulf_noconv)